KI-markørene (enn så lenge)

Den raske utviklingen av generative tekster har slått tydelig inn i akademia. En interessant observasjon er den hyppige bruken av visse ord og uttrykk, som crucial (avgjørende). Det er en av flere markører på at en tekst kan ha blitt produsert av eller med KI.

Til en leder i The Economist (27.06.2024) har bladet fått utarbeidet en statistikk over bruken av denne termen i PubMed-databasen. Det er et markant skille etter at Chat GPT ble tilgjengelig i november 2022.

Se også The telltale words that could identify generative AI text i Ars Technica 01.07.24.

Det er flere årsaker til at KI-generert tekst har større innslag av slike “godord”:

Nøkkelord: De store språkmodellene er bygd over store datasett fra et bredt spekter av akademiske tekster. Disse modellene lærer å identifisere og gjengi vokabular som er vanlig i vitenskapelige artikler. Crucial er en vanlig term i denne litteraturen for å betegne viktighet, noe som gjør det til et foretrukket ord når KI-maskinen genererer tekst.
Forutsigbare tekstmønstre: KI-modeller, som dem som er basert på GPT-arkitekturen, prøver å forutsi neste ord i en sekvens basert på kontekst. Ord som crucial blir ofte forutsagt i kontekst der viktighet eller betydning blir diskutert, noe som fører til hyppigere bruk i akademisk tekst.
Leksikalsk preferanse: KI-genererte tekster kan oppvise leksikalske preferanser som skiller seg ut på grunn av deres konsistens. For eksempel kan en KI-maskin produsere crucial fremfor synonymer som vitalt, vesentlig, essrnsielt. Det gir repetitiv bruk som kan indikere KI-generert tekst.

Andre markører

Det er mange andre termer som også kan antyde at en tekst er skrevet av KI:

Repetisjon av spesifikke fraser: KI-genererte tekster bruker ofte fraser som it is important to note that, in conclusion eller furthermore.
Formelt og stivt språk: KI-modeller har tendens til å produsere tekst som er overdrevent formell eller stiv. De er trent på en rekke formelle tekster og kan overgeneralisere den formelle tonen som kreves for akademisk skriving.
Inkonsekvent relevans: KI kan sette inn informasjon som nok kan ha relevans, men som virker malplassert i den umiddelbare kontekst. Det oppfattes som malplassert. ,
Uvanlige synonymer: KI kan bruke teknisk sett korrekte synonymer, men uvanlige i vanlig bruk som commence i stedet for begin eller terminate i stedet for end.
Strukturert redundans: KI-tekster gir strukturert argumentasjon og forklaring, noe som kan føre til redundans. For eksempel gjentas ofte det samme punkt med andre ord flere ganger gjennom teksten.

If you can’t beat them

Economist-artikkelen slår til lyd for å bruke generatv tekst. Den kritiserer tidsskriftet Nature for å legge hindringer i veien. Det er i tråd med markedsliberalismen som bladet er tuftet på:

Forskere er ikke bare opptatt av laboratoriearbeid eller de store tanker. De arbeider under tidspress for å skrive artikler og undervise til å fylle ut endeløse søknader om tilskudd. Språkmodeller hjelper til ved å gi større tempo i skrivingen av artikler, og frigjør dermed tid for forskere til å utvikle nye ideer, samarbeide eller sjekke for feil i arbeidet.

Teknologien jevner ut konkurransen som er skjevfordelt til fordel for engelsktalende siden så mange av de prestisjefylte tidsskriftene er på deres språk. Språkmodeller kan hjelpe dem som ikke behersker språket godt med å oversette og redigere sine bidrag. Takket være språkmodeller bør forskere overalt kunne spre sine funn lettere, og bli vurdert på grunnlag av kvaliteten ideer og forskning i stedet for engelskferdighetene.

Bloggposter: 60