KI-teamet ved UiT Norges arktiske universitet

Jeg skriver som leder for UiTs KI-team ved UiT Norges arktiske universitet.

Jeg har lest utvalgets foreløpige vurderinger med stor interesse, særlig delene om sensur og karakterbegrunnelse. Jeg merker meg at utvalget anbefaler at universiteter og høyskoler gjør forsøk med KI-systemer til sensur og karakterbegrunnelse, både som automatisering og som vurderingsstøtte. Jeg er også klar over at notatet er foreløpig, og at utvalget ønsker innspill på vurderingene som er lagt frem.

Det er nettopp i den ånden jeg tillater meg å ta kontakt. I vårt arbeid med KI i utdanning har vi stusset over det som for oss fremstår som en mulig spenning mellom anbefalingene om utprøving og ordlyden i KI-forordningen. Slik vi leser forordningen, er systemer som er beregnet på å vurdere læringsutbytte i utgangspunktet høyrisikosystemer. Samtidig åpner artikkel 6 nr. 3 for unntak i visse tilfeller, blant annet der systemet ikke i vesentlig grad påvirker utfallet av beslutningsprosessen, eller der det utfører mer avgrensede forberedende eller støttende oppgaver.

Det vi opplever som uklart, er hvor langt dette unntaket kan strekkes i praksis. Særlig gjelder dette situasjoner der KI først foreslår sensur eller vurdering, og et menneske deretter kvalitetssikrer resultatet. For oss er det ikke opplagt at en slik modell uten videre faller utenfor høyrisiko-kategorien. Tvert imot kan det se ut som om dette er en mer vidtgående tolkning enn det som følger mest direkte av forordningens ordlyd og eksempler, hvor skillet kanskje heller går mellom KI som støtter en allerede gjennomført menneskelig vurdering, og KI som selv inngår i den primære evalueringen av læringsutbytte.

Jeg ville derfor høre om utvalget har gjort seg noen ytterligere refleksjoner om denne grensedragningen. Ser dere anbefalingene om forsøk med KI til sensur og karakterbegrunnelse som avhengige av et fortsatt uklart og åpent tolkningsrom i KI-forordningen, eller mener dere at dette allerede nå hviler på et relativt klart rettslig grunnlag?

Vi spør ikke for å være polemiske, men fordi dette raskt kan få betydning for hvordan institusjoner utformer lokale praksiser og pilotprosjekter. For oss er det viktig å forstå hvor det reelle handlingsrommet går, og hvor det fortsatt er behov for varsomhet og ytterligere avklaringer.