- Global Voices po polsku - https://pl.globalvoices.org -

Program typu “text-to-speech” uczy wymowy słów w języku keczua w serwisach społecznościowych

Kategorie: Media obywatelskie
Logo del proyecto, usado con autorización.

Logo Hinantin – projektu mającego na celu rozwój programu promującego wymierający rdzenny język keczua. Wykorzystano za zgodą właściciela.

Pewna peruwiańska grupa badawcza [1] stworzyła aplikację z funkcją “text-to-voice” [2] przetwarzającą tekst w języku keczua [3] na mowę, którą potem publikuje na takich serwisach społecznościowych jak YouTube [4]Twitter [5], czy Facebook [6].

Grupa Hinantin [7]z siedzibą w Cusco specjalizuje się w rozwoju badań i oprogramowania w dziedzinie lingwistyki komputerowej i pracuje obecnie nad promowaniem lokalnych języków Peru, jako że ilość osób, która się nimi posługuje, maleje [8].

Ekipa Global Voices rozmawiała z Richardem Castro, jednym z założycieli Hinantin, który wyjaśnił nam, że jest to pierwszy z kilku projektów programistycznych związany z językiem keczua, takich jak aplikacja z funkcją “text-to-voice” [2], która potrafi automatycznie przetwarzać tekst na mowę (dotyczy odmiany z Cusco), internetowy korektor pisowni [9], czy wtyczka do edytora tekstu LibreOffice [10].

Głównym zadaniem projektu dotyczącego aplikacji “text-to-voice” [2] jest przetwarzanie za pomocą odtwarzacza frazy lub słowa dnia w języku keczua na mowę, a następnie publikacja uzyskanego w ten sposób nagrania na serwisach społecznościowych. Na profilu projektu na Instagramie [11] wraz ze słowem dnia udostępniane są także obrazki oraz odpowiedniki w różnych językach. Nagrania są także dostępne na platformie SoundCloud [12].

Natomiast na tym wideo z platformy YouTube [13] Hinantin uczy, jak poprawnie wymawiać słowo maywa oznaczające “fioletowy”:

Program został stworzony na podstawie korpusu (zbioru) tekstów i próbek mowy dla języka keczua. Projekt skupia się na dialektach Cusco, Puno i Lima, jako że tłumacze odpowiedzialni za ten etap przedsięwzięcia pochodzą właśnie z tych regionów. Każda osoba użyczająca swojego głosu w nagraniach mówi w używanej przez siebie odmianie, jednak system pisma używany w plikach wideo i podcastach należy do dialektu południowego [14].

Wszyscy tłumacze mogą korzystać z wybranego przez siebie systemu, ponieważ teksty wprowadzane do programu automatycznie przybierają postać południowej odmiany keczua [15]. Uczestnicy projektu porównują tłumaczenia z dostępnymi tłumaczami automatycznymi [16] w celu wykrycia ewentualnych błędów i dostrzeżenia zalet nagrań wykonanych w ramach przedsięwzięcia.

Jednym z przeznaczeń korpusu tekstów i próbek mowy jest nauka języka keczua poprzez platformę elektroniczną RunaSimi [17]. Z tego względu, osoby pracujące przy projekcie stworzyły podgrupę [18] korpusu tekstowo-dźwiękowego.

Grupa Hinantin bierze także czynny udział w rozwoju innych programów wspierających lokalne języki, takie jak keczua, asháninka, czy ajmara.

Ponieważ takie języki są częścią peruwiańskiego dziedzictwa kulturowego [19], ich ocena oraz użycie są nieodłączną częścią polityki promocji różnorodności i wymiany międzynarodowej. Szacuje się, że w kraju funkcjonuje obecnie ponad 50 żywych języków rodzimych [20], a także wiele innych, które są już uważane za wymarłe. Peruwiańskie Ministerstwo Kultury opracowało [21] Narodowy Dokument Języków Rodzimych z oficjalnymi danymi dotyczącymi poszczególnych języków oraz ich użytkowników. Zawiera on także informacje o miejscach, w których można się ich nauczyć, a także mapę ze statystykami [22] przedstawiającą ich nagrania.