Når der tales kunstig intelligens tales også ofte om behovet for ‘en dansk sprogmodel’. Hvorfor det?
SF har bl.a. fremsat forslag til folketingsbeslutning. Man ønsker en stor dansk sprogmodel udviklet f.eks. på basis af Det Kgl. Bibliotek og andre danske vidensdatabaser, også kaldet Large Language Model, LLM, som det kendes fra bl.a. OpenAI’s ChatGPT, fordi ”Både i EU-regi og i Danmark har vi nogle særlige værdier og regelsæt, som amerikanske sprogmodeller ikke tager højde for.”
Vicedirektør for Det Kgl. Bibliotek Cecile Christensen interviewes 31. april i en DM Digi artikel om en sprogmodel baseret på Det Kgl. Biblioteks digitale samlinger med bøger, avisartikler, tidsskrifter og radio- og tv-udsendelser mange år tilbage og bibliotekets høst af alle den danske del af internettets data fire gange om året. ”Det er vigtigt at gøre sig klart, at sprogmodeller er mange ting, og det handler ikke nødvendigvis om en dansk udgave af ChatGPT, men om at stille basissprogmodeller trænet på danske, nordiske eller europæiske data til rådighed for offentlige institutioner og virksomheder.”
Desuden er Alexandra Instituttet, IBM Danmark og Dansk Erhverv gået i spidsen for en række danske private og offentlige organisationer for sammen at skabe danske sprogmodeller. Dansk Sprogmodel Konsortiet er et værdibaseret fællesskab, der er åbent for alle, der kan tilslutte sig dets formål og principper. Medlemmerne vil sikre transparens og ophavsrettigheder til danske data, så sprogmodellerne trygt kan anvendes.
Potentialet i kunstig intelligens (AI) er stort og i Sverige er man for eksempel allerede i gang med at udvikle en sprog-model.