LuxASR: Automatesch Transkriptioun elo och op Lëtzebuergesch

LuxASR steet fir Automatic Speech Recognition for Luxembourgish. Fir datt d'Software iwwerhaapt lëtzebuergesch Texter verschaffe kann, huet si misste mat grousse Quantitéiten un Audiomaterial trainéiert ginn.

De Professer Peter Gilles, Linguist op der Uni Lëtzebuerg an Haaptverantwortlechen hanner dem Projet, erkläert:

"Mir ginn der Maschinn Beispiller vu klengen Audioextrakten - dräi, véier oder drësseg Sekonnen - a parallel dozou de geschriwwenen Text. An dovunner brauch een esou vill wéi méiglech."

Bis elo goufen ongeféier 150 Stonnen Audio benotzt - wäit manner wéi déi Millioune Stonnen, déi fir grouss Weltsprooche wéi Englesch oder Spuenesch zur Verfügung stinn.

Fortschrëtter duerch nei Technologien

Trotzdeem huet LuxASR sech zënter dem Start am Joer 2022 méi séier entwéckelt wéi erwaart. Grond dofir si béid nei Algorithmen am Beräich vum Machine Learning an eng ëmmer méi performant Hardware.

"An de leschte Jore sinn nei Prozessoren erauskomm, déi esou Saache speziell gutt kënne léisen."

De Moment verschafft de System 500 bis 1.000 Stonnen Audio de Mount an dat mat enger Vitess vu bis zu 170 Wierder d’Sekonn - also däitlech méi séier wéi all Mënsch schwätze kann.

Grenzen a Problemer

Well LuxASR virun allem mat Audiomaterial aus Chamberssëtzungen trainéiert gouf, ass d'Software am beschten op dëse Kader ugepasst. Méi schwiereg bleift et bei Dialekter oder spontaner, onreegelméisseger Sprooch.

"Wat ee méi noléisseg schwätzt, sech korrigéiert oder e Saz net fäerdeg mécht, do kritt de System Problemer. Dat ass e generelle Problem - net nëmme bei eisem Projet."

Méiglech Uwendunge fir Politik a Fuerschung

Eng praktesch Iddi: LuxASR kéint an Zukunft Live-Transkriptiounen an der Chamber liwweren. "Technesch ass de System séier genuch, et ass just nach eng Fro vun der Ëmsetzung", erkläert de Professer Peter Gilles.

Zil vum Projet ass awer méi wäitreechend: LuxASR soll wëssenschaftlech Recherche vereinfachen an op laang Siicht zu engem Ecosystem vun Tools ausgebaut ginn - mat kënschtlecher Stëmm, Iwwersetzungen an enger Aart ChatGPT op Lëtzebuergesch.

"Lëtzebuergeschen Audio eran an eng Äntwert op Lëtzebuergesch zeréck - dat kéint eng Kombinatioun aus Transkriptioun, Iwwersetzung a Large Language Models ginn."

Visioun fir d'Zukunft

Aktuell schafft de Professer bal eleng um Projet, ënnerstëtzt vun engem Post-Doc a engem Doktorand. Mee d'Perspektive si grouss: eng kënschtlech Stëmm op Lëtzebuergesch, eng Iwwersetzungsplattform an eng integréiert Sprooch-KI.

Bis dohi ka LuxASR awer elo schonn genotzt ginn: jidderee kann domat Audio- a Videodateien automatesch op Lëtzebuergesch transkribéieren. Eng éischt Testversioun vun der Iwwersetzung existéiert schonn.

Lauschteren

Musek a Kultur

Lëtzebuerger Sprooch a KI