Tar AI-fusket död på högskolan?

Verktyg som Chat GPT gör det möjligt att klara tentor utan att lära sig något. Nu varnar akademiker för en förtroendekris för den högre utbildningen.

Text:

Bild: Bjørn Sigurdsøn / NTB

Det har aldrig varit lättare att fuska än det är i dag. Förr kunde man visserligen be en släkting om hjälp, eller betala någon för att skriva en uppsats. I dag är allt man behöver en internetuppkoppling. AI-verktyg som Chat GPT kan skriva uppsatser på några ögonblick – och lärarna har inget sätt att veta om det har skett.

– Det finns en massa verktyg som är tänkta att identifiera fusk, men de är inte tillförlitliga. De kan både påstå att en text som är genererad av en chatbot är skriven av en människa – och tvärtom, säger Cormac McGrath, universitetslektor i pedagogik vid Stockholms universitet.

Lärare ser inte skillnad

Han var med och gjorde en studie när Chat GPT var relativt nytt, där universitetslärare i pedagogik, sociologi, juridik och filosofi fick bedöma en blandning av verkliga och AI-genererade uppsatser. Trots att studien genomfördes 2023, då verktygen för att generera text var påtagligt mer primitiva än i dag – och trots att lärarna var medvetna om att det kunde finnas inslag av AI-genererad text i materialet de bedömde, hade de svårt att värdera om texterna var producerade av en chatbot.

Det hände att de uppfattade innehållet eller referenserna som irrelevanta för uppgiften, och tolkade det som ett tecken på AI-fusk – bara för att upptäcka att det i själva verket varit verkliga studenter som skrivit uppsatserna. Sorgligt nog misstänkte de också att Chat GPT hade varit inblandat när texterna var ”för” välskrivna, även i fall då författaren helt enkelt var en välformulerad student.

Det är dessutom tänkbart att lärarna i studien var mer vaksamma än de hade varit om ingen hade förvarnat dem om förekomsten av AI-text. När forskare vid Reading University i Storbritannien lämnade in AI-genererade provsvar från fiktiva studenter till professorer som inte visste att de var föremål för ett experiment, flaggades enbart ett av 33 prov som fusk. De övriga fick högre snittbetyg än de riktiga studenterna.

Problemet med false negatives och false positives förekommer även i de verktyg som utger sig för att kunna identifiera AI-genererat material. Inte ens Open AI, företaget som utvecklade Chat GPT, lyckades skapa ett tillförlitligt verktyg utan lade diskret ner projektet sommaren 2023.

Stort mörkertal

Det är svårt att säga exakt hur vanligt AI-fusk är. När fackförbundet Akavia frågade studenter vid svenska högskolor om de använder så kallad generativ AI i sina studier svarade 40 procent ja. Men alla som använder chatbotar i sina studier gör det inte nödvändigtvis för att fuska. Det är inte ens alltid uppenbart vad som är fusk och inte.

– Studenter säger sig inte veta var gränsen går. Många använder till exempel AI i syfte att förbättra sitt språk. Häromdagen pratade jag med juristkollegor som säger sig ha sett en märkbar förbättring i det skrivna språket bland studenter sedan chatbotarna lanserades, säger McGrath.

Huruvida det är fusk eller inte att förbättra sitt dåliga språkbruk med digitala hjälpmedel är en öppen fråga. Men det förekommer också att AI-användningen går längre än så. En undersökning från Ungdomsbarometern bland svenskar mellan 15 och 24 år sommaren 2023 visade att hälften av dem som använde AI i skolarbetet gjorde det på ett sätt de inte trodde var tillåtet. Och en brittisk undersökning bland studenter visade att var åttonde använder chatbotar för att producera text de betygsätts på, även om många skriver om texterna i någon mån innan de lämnar in dem.

Samtidigt är det försvinnande få som åker dit för AI-fusk. Mellan januari och början av november 2024 blev enbart 134 studenter avstängda från högre studier i Sverige efter tillåten användning av AI-verktyg. Mycket pekar på att mörkertalet är stort.

Trots det skrivs en stor andel av tentor vid svenska universitet och högskolor hemma. Enligt Ali Kazemi, professor i psykologi vid Högskolan Väst, förekommer det inom både humaniora och samhällsvetenskap att hemtentor utgör det enda betygsgrundande momentet på en kurs – alltså att man kan få godkänt enbart baserat på material man kan producera med hjälp av en chatbot.

– När det finns AI-verktyg som kan producera unikt och välformulerat innehåll som inte upptäcks av de verktyg som finns för plagiatkontroll, då har vi en trovärdighetskris i den högre utbildningen, säger han.

Förtroendekris

Det är inte bara fråga om ett minskat förtroende för betygssystemet, utan även för examen från högre utbildning.

– Föreställ dig att du besöker sjukvården och möts av en nyutexaminerad läkare eller sjuksköterska. Vi vet att man under pandemin i hög grad gick över från salstentor till digitala hemtentor. Och vi vet att man har tillgång till verktyg som låter en författa texter som inte bygger på en egen självständig läsning och förståelse av litteraturen. Ingen vill riskera att sätta sitt liv i händerna på personal som inte har tagit till sig av det som lärs ut på utbildningen, säger Kazemi.

Det framstår som en aning naivt av högskolor och universitet att använda sig av hemtentor när det inte går att veta om de över huvud taget är skrivna av en människa. Men enligt Cormac McGrath har hemtentor en fördel: de gör det möjligt att utveckla resonemang man inte hinner med under en salstenta på några timmar – och förstås att de möjliggör distansstudier. Enligt honom behöver universitetslärare i stället se till att säkerställa att svaren på hemtentorna faktiskt speglar studentens kompetens.

Sådana försök görs redan, i någon mån. KTH har till exempel instruktioner till lärare för att förhindra AI-fusk, till exempel att ersätta hemtentor med muntliga examinationer eller åtminstone formulera tentafrågor som tvingar studenterna att reflektera över kurslitteraturen. I undersökningen från Akavia rapporterade en tredjedel av svenska studenter att undervisningen har gjorts om i syfte att förebygga AI-fusk, ofta genom att hemtentor har ersatts med salstentor.

Men för att hindra trovärdigheten i den högre utbildningen från att helt urholkas, säger Kazemi att själva kulturen inom akademin behöver utvecklas.

– Vi kan inte totalförbjuda AI, för då kommer vi bara att se mängden fusk och disciplinärenden att öka. Studenterna måste själva vilja utveckla sitt kritiska tänkande, bli bättre på att lösa problem och bilda sig – alltså det en utbildning är till för. Och det kräver att vi pratar mer om grundläggande värden som akademisk integritet, etik och personligt ansvar, säger han.

***

Det har aldrig varit lättare att fuska än det är i dag. Förr kunde man visserligen be en släkting om hjälp, eller betala någon för att skriva en uppsats. I dag är allt man behöver en internetuppkoppling. AI-verktyg som Chat GPT kan skriva uppsatser på några ögonblick – och lärarna har inget sätt att veta om det har skett.

– Det finns en massa verktyg som är tänkta att identifiera fusk, men de är inte tillförlitliga. De kan både påstå att en text som är genererad av en chatbot är skriven av en människa – och tvärtom, säger Cormac McGrath, universitetslektor i pedagogik vid Stockholms universitet.

Lärare ser inte skillnad

Han var med och gjorde en studie när Chat GPT var relativt nytt, där universitetslärare i pedagogik, sociologi, juridik och filosofi fick bedöma en blandning av verkliga och AI-genererade uppsatser. Trots att studien genomfördes 2023, då verktygen för att generera text var påtagligt mer primitiva än i dag – och trots att lärarna var medvetna om att det kunde finnas inslag av AI-genererad text i materialet de bedömde, hade de svårt att värdera om texterna var producerade av en chatbot.

Det hände att de uppfattade innehållet eller referenserna som irrelevanta för uppgiften, och tolkade det som ett tecken på AI-fusk – bara för att upptäcka att det i själva verket varit verkliga studenter som skrivit uppsatserna. Sorgligt nog misstänkte de också att Chat GPT hade varit inblandat när texterna var ”för” välskrivna, även i fall då författaren helt enkelt var en välformulerad student.

Det är dessutom tänkbart att lärarna i studien var mer vaksamma än de hade varit om ingen hade förvarnat dem om förekomsten av AI-text. När forskare vid Reading University i Storbritannien lämnade in AI-genererade provsvar från fiktiva studenter till professorer som inte visste att de var föremål för ett experiment, flaggades enbart ett av 33 prov som fusk. De övriga fick högre snittbetyg än de riktiga studenterna.

Problemet med false negatives och false positives förekommer även i de verktyg som utger sig för att kunna identifiera AI-genererat material. Inte ens Open AI, företaget som utvecklade Chat GPT, lyckades skapa ett tillförlitligt verktyg utan lade diskret ner projektet sommaren 2023.

Stort mörkertal

Det är svårt att säga exakt hur vanligt AI-fusk är. När fackförbundet Akavia frågade studenter vid svenska högskolor om de använder så kallad generativ AI i sina studier svarade 40 procent ja. Men alla som använder chatbotar i sina studier gör det inte nödvändigtvis för att fuska. Det är inte ens alltid uppenbart vad som är fusk och inte.

– Studenter säger sig inte veta var gränsen går. Många använder till exempel AI i syfte att förbättra sitt språk. Häromdagen pratade jag med juristkollegor som säger sig ha sett en märkbar förbättring i det skrivna språket bland studenter sedan chatbotarna lanserades, säger McGrath.

Huruvida det är fusk eller inte att förbättra sitt dåliga språkbruk med digitala hjälpmedel är en öppen fråga. Men det förekommer också att AI-användningen går längre än så. En undersökning från Ungdomsbarometern bland svenskar mellan 15 och 24 år sommaren 2023 visade att hälften av dem som använde AI i skolarbetet gjorde det på ett sätt de inte trodde var tillåtet. Och en brittisk undersökning bland studenter visade att var åttonde använder chatbotar för att producera text de betygsätts på, även om många skriver om texterna i någon mån innan de lämnar in dem.

Samtidigt är det försvinnande få som åker dit för AI-fusk. Mellan januari och början av november 2024 blev enbart 134 studenter avstängda från högre studier i Sverige efter tillåten användning av AI-verktyg. Mycket pekar på att mörkertalet är stort.

Trots det skrivs en stor andel av tentor vid svenska universitet och högskolor hemma. Enligt Ali Kazemi, professor i psykologi vid Högskolan Väst, förekommer det inom både humaniora och samhällsvetenskap att hemtentor utgör det enda betygsgrundande momentet på en kurs – alltså att man kan få godkänt enbart baserat på material man kan producera med hjälp av en chatbot.

– När det finns AI-verktyg som kan producera unikt och välformulerat innehåll som inte upptäcks av de verktyg som finns för plagiatkontroll, då har vi en trovärdighetskris i den högre utbildningen, säger han.

Förtroendekris

Det är inte bara fråga om ett minskat förtroende för betygssystemet, utan även för examen från högre utbildning.

– Föreställ dig att du besöker sjukvården och möts av en nyutexaminerad läkare eller sjuksköterska. Vi vet att man under pandemin i hög grad gick över från salstentor till digitala hemtentor. Och vi vet att man har tillgång till verktyg som låter en författa texter som inte bygger på en egen självständig läsning och förståelse av litteraturen. Ingen vill riskera att sätta sitt liv i händerna på personal som inte har tagit till sig av det som lärs ut på utbildningen, säger Kazemi.

Det framstår som en aning naivt av högskolor och universitet att använda sig av hemtentor när det inte går att veta om de över huvud taget är skrivna av en människa. Men enligt Cormac McGrath har hemtentor en fördel: de gör det möjligt att utveckla resonemang man inte hinner med under en salstenta på några timmar – och förstås att de möjliggör distansstudier. Enligt honom behöver universitetslärare i stället se till att säkerställa att svaren på hemtentorna faktiskt speglar studentens kompetens.

Sådana försök görs redan, i någon mån. KTH har till exempel instruktioner till lärare för att förhindra AI-fusk, till exempel att ersätta hemtentor med muntliga examinationer eller åtminstone formulera tentafrågor som tvingar studenterna att reflektera över kurslitteraturen. I undersökningen från Akavia rapporterade en tredjedel av svenska studenter att undervisningen har gjorts om i syfte att förebygga AI-fusk, ofta genom att hemtentor har ersatts med salstentor.

Men för att hindra trovärdigheten i den högre utbildningen från att helt urholkas, säger Kazemi att själva kulturen inom akademin behöver utvecklas.

– Vi kan inte totalförbjuda AI, för då kommer vi bara att se mängden fusk och disciplinärenden att öka. Studenterna måste själva vilja utveckla sitt kritiska tänkande, bli bättre på att lösa problem och bilda sig – alltså det en utbildning är till för. Och det kräver att vi pratar mer om grundläggande värden som akademisk integritet, etik och personligt ansvar, säger han.

***