Reconoixe

Reconoxedor de voz

En desembolique
Reconoixe: Reconoxedor de voz (en desembolique)

A iniziativa ReconoiXe ha permitiu obtener más de 75 oras de gravazión en as cualas son presens totas as variedaz dialectals.

O Departamento d’Educazión, Cultura y Esporte d’o Gubierno d’Aragón –a traviés d’a Direzión Cheneral de Politica Lingüistica– ha desarrollau una iniziativa que permitirá obtener un reconoxedor de voz de l’aragonés: ReconoiXe.

Iste proyeuto, que s’enmarca en o programa Linguatec y se desarrolla en colaborazión con Lo Congres Permanent d’a Lenga Ozitana, o Rolde d’Estudios Aragoneses y a Fundazión Elhuyar.

A reconoixenzia de voz ye a ferramienta que analisa a voz y a transcribe en forma de testo escrito. Forma parte d’as teunolochías de tratamiento de palabras que permiten a los umanos intercambiar oralmén con as maquinas, grazias a interfazes de voz. A reconoixenzia de voz ye esenzial ta creyar ferramientas como subtitulau automatico de vidios, aplicazions de dictau d’asistens personals intelichens u de voz.

As teunolochías d’o parlache (reconoixenzia de voz, sintesi de voz, traduzión automatica u analisi semantica), son un tema vital ta las luengas minoritarias. Ta interactuar en una soziedat cada vez más dichital, cal disposar d’os recursos y ferramientas nezesarios para que os fablans leven a cabo intercambios en o suyo propio idioma a traviés d’interfazes. En ista linia de treballo, dende a Direzión Cheneral de Politica Lingüistica s’han empentau cuantos programas a traviés d’o programa europeu Linguatec (traduzión automatica –TraduZe–, sintesi de voz y dizionario on line bidirezional –Aragonario–), una barra web descargable, un teclau predictivo, etz.

A reconoixenzia de voz permite a transcripzión de voz a testo, una teunolochía que uei ye ampliamén distribuyida en aplicazions publicas en cheneral, en particular por asistens personals (Apple Siri, Google Home u Amazon Alexa son os más conoxius) y ta lo subtitulau automatico de vidios.

A reconoixenzia de voz utiliza intelichenzia artifizial (rez neuronals) ta transcribir automaticamén voz a testo escrito. Antes de poder fer isto, ha d’entrenar-se con orazions d’audio ya transcritas. Por tanto, amenesta una gran cantidat d’audio transcrito, ye dezir, una gran cantidat de testo con as correspondiens gravazions d’audio. Tamién ye nezesario «alimentar a maquina» con grans corpus de testo, y ye alavez cuan puede aprender qué formas son frecuens, qué palabra apareixe a ormino chunto a unatra, ezetera. Ta ixo, cal desarrollar cuantos programas:

  • Un ta escribir numeros, símbolos, abreviaturas, unidaz de mida, ezetera, antes d’inviar un mandau de testo a la maquina.
  • Una «abreviatura» que fa lo contrario, ta fer más leyibles os testos ofrexius a los usuarios.
  • Un fonetizador ta obtener a prenunzia de l’alfabeto fonetico internazional d’una palabra.
  • Un programa ta tener totas as palabras que corresponden a una prenunzia.

ReconoiXe ye o nombre que prene o proyeuto ta l’aragonés que consta d’as siguiens fases:

  • Primera fase 2020: Definizión de requisitos, espezificazions funzionals y constituzión d’o corpus

Un primer trango, ya desarrollau, ha consistiu en describir os requisitos teunicos, asinas como as espezificazions funzionals. Dende un punto de vista teunico ista tecnolochía requiere una gran cantidat de datos. Nomás un corpus rico, voluminoso y variau guarenziará un resultau de calidat a la fin d’a cadena. Ta ixo, s’ha demandau a colaborazión de personas y asoziazions que han levau a cabo locuzions de forma expresa ta ista aplicazión, o que agradeixemos fundamén, u bien s’han obteniu de gravazions ya existens. D’iste modo s’han alcanzau más de 75 oras de gravazión en as cualas son presens totas as variedaz dialeutals, de traza que totas ellas puedan estar reconoxidas y transcritas por as maquinas.

Ista primera fase s’ha dedicau, pus, a lo treballo de recolezión, prozesamiento (aliniazión de testo / son) y almagazenamiento d’audio y de corpus testual, en fase d’elaborazión, ta lo que será de gran utilidat o traductor automatico (TraduZe) rezienmén meso en produzión.

  • Segunda fase 2021: Finalizazión y desembolique teunolochico.

Gran parte d’o proyeuto s’ha levau a cabo entre ista segunda fase: completar a recolezión de datos nezesarios ta plegar a una versión de desembolique abanzau.

  • Tercera fase 2022: Desembolique final
  • Cuatrena fase 2023: Validazión

En a primera parte d’ista zaguera fase, toz os desemboliques teunolochicos d’o proyeuto serán remataus. Tamién se rematará a fase de construzión de transcriptors. Una vez integraus toz os componens teunolochicos, serán sozmetius a una serie de prebas avaluazión intensiva.