Martin Carsten Nielsen, Co-Founder and CEO of Alvenir. Photo: Hanne Kokkegård, DTU Compute

Software fra DTU-spinout genkender selv små sprog

Monday 01 Aug 22

Contact

Rasmus Stig Beck Jensen
Special Consultant
DTU Compute

Kort om sprog i Europa - EU

Alvernir vil gerne sikre, at Europas små sprog også lever digitalt i fremtiden. Det flugter godt med EU, der oversætter de fleste af sine dokumenter til de 24 officielle sprog i EU. Et af EU’s grundlæggende principper er nemlig flersprogethed.

Formålet med flersprogethed er at:

  • kommunikere med borgerne på deres eget sprog
  • beskytte Europas rige sproglige mangfoldighed
  • fremme sprogindlæring i Europa

Kilde: Den Europæiske Union

Fremtidens computerteknologi bør kunne forstå alle, mener Alvenir, hvis talegenkendelse i mange tilfælde er bedre til dansk end giganternes.

Da jeg forleden hastede gennem trafikken, bad jeg min smartphones digitale assistent undersøge åbningstiderne på biblioteket. Selv om jeg forsøgte at tale meget tydeligt, forstod assistenten mig ikke. Det sker ofte. 

Generelt har digitale assistenter svært ved at forstå dansk, for de store it-selskabers sprogmodeller er ikke specialiseret godt nok på så lille et sprog som dansk. Det samme gælder andre sprog, der heller ikke er et af de store hovedsprog. 

Her kan den danske startup Alvenir komme først os i Danmark og senere andre små sprogområder til hjælp. Firmaet har specialiseret sig i at lave industri-specifikke modeller, som i udgangspunktet rammer rigtigt cirka 90 procent af tiden og op imod 100 procent, hvis den bliver tilpasset en virksomheds fagudtryk og produktnavne. 

”Vi har alle ret til at blive forstået af fremtidens computerteknologi. Uanset om vi er gamle, mumler eller er fra et lille sprogområde med en speciel accent. Alvenirs mål er at demokratisere hele Europa. Der er utrolig mange små sprog i Europa, og for mange af dem ligger der en stor opgave i at få skabt gode generelle modeller, som kan agere fundament for den industrispecialisering, vi fokuserer på, på dansk. Vi er i gang i Danmark, ved udgangen af 2024 er det planen, at vi vil skalere til Norden, og om 10 år sidder vi tungt som en børsnoteret virksomhed i det europæiske marked,” siger CEO og medstifter af Alvenir Martin Carsten Nielsen.

Alvenir bygger på viden fra et DTU Compute-speciale, hvor Martin Carsten Nielsen og Rasmus Arpe Fogh Egebæk under ledelse af professor Lars Kai Hansen i forskningssektionen Kognitive Systemer har udviklet AI-baserede modeller til talegenkendelse (Danspeech). Med hjælp fra DTU’s supportnetværk til entreprenørskab har de to iværksættere formet forretningsideen. DTU underskrev 1. april 2022 en aftale om teknologi-overførelse, som der er blevet betalt for i en ejerskabsmodel. Siden da har Alvenir kunnet kalde sig en spinout, der er kendetegnet ved, at teknologien er rykket fra grundforskning til noget, der skaber værdi for samfundet.

Digitalt dansk risikerer at uddø

Alvenirs målsætning om at demokratisere Europa med sine sprogmodeller kan blandt andet aflæses i selskabets ’open core’ forretningsmodel, hvor store dele af selskabets maskinlæringsmodeller udstilles open source på udviklerportalerne GitHub og HugginFace, mens den bagvedliggende software udvikles og vedligeholdes bag lukkede døre.

”Lige nu har vi en masse sprog i Europa, der er underrepræsenteret i digital talegenkendelse, og det, synes vi, er super ærgerligt. Fordi vi i Danmark er så gode til engelsk, accepterer vi, at vores devices snakker engelsk, og det propagerer ned i vores børn og børnebørn. På et eller andet tidspunkt risikerer ’digital dansk’ at uddø. Det samme vil være gældende for mange andre sprog digitalt, hvis ikke der er nogen, der vil være med til at sikre fremdrift,” siger Martin Carsten Nielsen.

Alvenirs drøm har lige fra begyndelsen været at udvikle og udstille danske talegenkendelsesmodeller, som kan udgøre et reelt alternativ til de services, der bliver tilbudt af de store IT-giganter. 

”En drøm som stadig er en vigtig drivkraft for vores arbejde med Alvenir. I dag er den drivkraft så også blevet til en konkurrencemæssig fordel, fordi vi har identificeret en række brugsscenarier, hvor vi faktisk kan udkonkurrere selvsamme løsninger med en ikke ubetydelig margin,” siger Martin Carsten Nielsen.

”Men Tech-giganterne hviler jo heldigvis ikke på laurbærrene, og eftersom vi ikke har en hær af dygtige folk til at forske og udvikle for os, er det derfor også en vigtig kerneværdi for os at være med til at udvikle communitiet omkring open source-taleteknologi, så vi kan forblive relevante i markedet." 

 In front Kasper Schjødt-Hansen, Lead AI Engineer at Alvenir (left) & Rasmus Stig Beck Jensen, Business Unit Manager at DTU Compute. Photo: Hanne Kokkegård, DTU Compute
Alvenir har kontor hos CPH Fintech på Christianshavn i København. - Forrest Kasper Schjødt-Hansen, Lead AI Engineer i Alvenir (venstre) & Rasmus Stig Beck Jensen, Business Unit Manager på DTU Compute. Photo: Hanne Kokkegård, DTU Compute. 

Sprogmodeller breder sig

"Vi har alle ret til at blive forstået af fremtidens computerteknologi. Uanset om vi er gamle, mumler eller er fra et lille sprogområde med en speciel accent. Alvenirs mål er at demokratisere hele Europa."
CEO og medstifter af Alvenir Martin Carsten Nielsen.

Talegenkendelse får stadig større betydning for virksomheder, fordi det er en nem måde at dokumentere, hvad bliver der sagt i samtaler både til intern brug og kundeopfølgning. F.eks. ved forsikringssager, hvor der er krav om dokumentation for kundekontakten for at sikre, at folks sager bliver behandlet korrekt. Her kan Alvenir lytte med og skrive samtaler ud. 

Alvenir-platformen har i det hele taget brede anvendelsesmuligheder, f.eks. inden for lyd og podcastservice, hvor den gør det muligt at søge i biblioteker og give anbefalinger til brugerne. Men også inden for f.eks. sundhedsområdet og finanssektoren vil en sprogmodel, der lytter med, kunne forbedre kommunikation og sikkerhed.

”Hvis en kundemedarbejder skal skrive et resume ud fra en samtale på fire minutter, er det ret sandsynligt, at vedkommende glemmer noget. Her kan en god talegenkendelsesløsning være med til at sikre kvaliteten og på sigt sætte fokus på relevante dele af samtalen, så medarbejderens arbejde lettes, og der frigives tid til andre opgaver,” siger Martin Carsten Nielsen.

Andre virksomheder har mere brug for at lave en analyse på bagkant for f.eks. at se, hvordan et marked udvikler sig, og hvad kunderne er interesseret i. Også her kan talegenkendelse spille en værdifuld rolle ved at analysere og identificere tendenser i store mængder talt data, som virksomhederne efterfølgende kan bruge, når de skal træffe beslutninger.

Datahåndtering og machine learning

På overfladen ligner Alvenirs talegenkendelse dét, som allerede findes på markedet, men teknologien inde bag er forskellig, og det er ifølge Martin Carsten Nielsen én af Alvenirs styrker:

"Alvenir gemmer ikke automatisk data. I stedet foretrækker vi at bygge vores sprogmodel ind i kundens system, så data aldrig behøver forlade virksomheden. Det giver et øget ejerskab for den enkelte bruger, hvilket er en markant forskel fra mange af vores konkurrenter."

Alvenirs teknologi anvender signalprocessering og machine learning-moduler. Teknologien kigger på 20 millisekunders lyd ad gangen og lærer, hvordan lydbølgen ser ud for bogstaverne. 
På den måde modellerer teknologien akustiske billeder, hvor et ’a’ kan se ud på mange forskellige måder afhængig af, om der tales med dialekt, om mikrofonen fremmer diskant osv., og hvor modellen lærer at se mønstre og også se bort fra støj fra lydbilledet omkring selve lyden. 

Vigtigt at kunne kvantificere usikkerhed

Alvenirs teknologi giver også slutbrugeren mulighed for selv at ændre i talegenkendelsesmodellens datagrundlag, når der f.eks. skal tilføjes et nyt produkt med et unikt navn, som ikke er set før. Hvis værktøjet i sin aflytning hører et ukendt ord, sender den et lydklip tilbage til kunden og siger, at her er den usikker på, hvad der bliver sagt. Så på den måde kan brugeren selv introducere nye træningseksempler, som maskinlæringsmodellen kan lære af.

”For at lave en generel model, skal du bruge 100.000 timers data; det klarer vi. For domænespecifikke modeller skal du bruge 2000 timers data og en masse træning. Det klarer vi også. De sidste 2-3 procent, som gør, at modellen forstår kundens egne fagtermer, produktportefølje og virksomhedslingo, klarer kunderne selv ved at opdatere modellernes datagrundlag, efter at de er taget i brug,” siger Martin Carsten Nielsen og peger på, at det har en stor betydning, at Alvenir kvantificerer, hvornår sprogmodellerne er usikre.

Det kan have alvorlige konsekvenser i nogle virksomheder, hvis et sprog-domæne ikke er introduceret godt nok, og derfor er Alvenirs modeller ’assisterede løsninger’, så der er et menneske med i processen til at godkende en analyse eller beslutning, som er gjort på baggrund af en transskription.

”Det er netop diskussionen med voicebots, og der er mange forskellige grader af alvorlighed. Det er f.eks. ikke så alvorligt, hvis en borger bliver rådgivet forkert om åbningstider i svømmehallen. Men det bliver meget vigtigt at afgøre, hvornår vi føler os sikre nok til at lade en maskine træffe en beslutning – og hvornår vi skal sende det videre til varme hænder, hvis det eksempelvis handler om en afgørelse i en forsikringssag,” siger Martin Carsten Nielsen.

Martin Carsten Nielsen, Co-Founder and CEO of Alvenir. Photo: Hanne Kokkegård, DTU Compute
Martin Carsten Nielsen, Co-Founder and CEO of Alvenir. Photo: Hanne Kokkegård, DTU Compute. Alvenir har kontor hos CPH Fintech på Christianshavn.

DTU’s økosystem for entreprenørskab former folk

Rasmus Stig Beck Jensen, der er ansat som business unit manager med fokus på spinout og innovation på DTU Compute, har hjulpet Alvenir-stifterne Martin Carsten Nielsen og Rasmus Arpe Fogh Egebæk undervejs på deres tur gennem DTU’s økosystem for entreprenørskab:

”Udfordringen er altid at få noget, som dybest set er grundforskning – her basale videnskaber inden for computer science og kognitive systemer - til at passe ind i en virksomhedsverden, hvor tingene skal kunne bruges med det samme og skabe værdi for samfundet, og hvor der også er konkurrenter. Målet med Alvenir var at bygge et spinout, der kunne tjene penge helt fra dag ét. Det er en vanskelig opgave at starte en deep tech-virksomhed primært finansieret af kunder. Men, det er Alvenir blevet et fornemt eksempel på.” 

”Vi oplever ofte, at forskerne ikke ser sig selv som iværksættere. Så generelt skal vi arbejde meget mere med kulturen, og på DTU er vi godt i gang med at lave et decideret økosystem for iværksætteri, som også kan inspirere andre forskningsinstitutioner/universiteter. Entreprenørskab kan bidrage til mere værdiskabelse og endda skalering af forskningsresultater, og vi ser tit, at lige dét kan være motivationen for forskerne.”

Lige nu har Alvenir tre ansatte, men forventningen er, at man fra nytår er seks ansatte.

”Jeg tror, at de færreste for få år siden ville have peget på os (Rasmus Arpe Fogh Egebæk og Martin Carsten Nielsen, red.) og tænkt, at det var fremtidens iværksættere. Vi var nok blevet placeret som udviklere et eller andet sted, men det har DTU’s setup for entreprenørskab været med til at drive frem og vist, at det kan vi faktisk godt,” siger Martin Carsten Nielsen.  

Kort om Alvenir

  • Alvenir bygger på viden fra et DTU Compute-speciale, hvor Martin Carsten Nielsen og Rasmus Arpe Fogh Egebæk under ledelse af professor Lars Kai Hansen i forskningssektionen Kognitive Systemer udviklede en AI-baseret model til talegenkendelse (Danspeech).
  • Martin og Rasmus blev derefter ansat som researchassistenter på DTU Compute til at lave en softwarepakke, men specialeidéen viste sig at rumme en rigtig god forretningsmulighed, så grundforskning kunne komme ud og skabe værdi for samfundet.
  • Med hjælp fra DTU’s supportnetværk til entreprenørskab og programmet Open Entrepreneurship fik forskerne støtte fra først DTU Discovery Grant, der støtter DTU-ansattes arbejde med tidlig teknisk og kommerciel modning og risiko for teknologi. Dernæst penge fra DTU Proof of Concept Grant (POC), der giver tilskud til f.eks. udvikling af prototyper til brugervalidering og demonstration af skalerbarhed, men også til løn, eksterne konsulenter, rapporter med mere. Endelig har InnoExplorer Grant under Innovationsfonden gjort det muligt for Alvenir at arbejde videre med udvikling af produkt og forretningsplan.
  • DTU underskrev 1. april 2022 en aftale om teknologi-overførelse, som der er blevet betalt for i en ejerskabsmodel, så Alvenir officielt er en spinout.

News and filters

Get updated on news that match your filter.