Program typu “text-to-speech” uczy wymowy słów w języku keczua w serwisach społecznościowych

Logo del proyecto, usado con autorización.

Logo Hinantin – projektu mającego na celu rozwój programu promującego wymierający rdzenny język keczua. Wykorzystano za zgodą właściciela.

Pewna peruwiańska grupa badawcza stworzyła aplikację z funkcją “text-to-voice” przetwarzającą tekst w języku keczua na mowę, którą potem publikuje na takich serwisach społecznościowych jak YouTubeTwitter, czy Facebook.

Grupa Hinantin z siedzibą w Cusco specjalizuje się w rozwoju badań i oprogramowania w dziedzinie lingwistyki komputerowej i pracuje obecnie nad promowaniem lokalnych języków Peru, jako że ilość osób, która się nimi posługuje, maleje.

Ekipa Global Voices rozmawiała z Richardem Castro, jednym z założycieli Hinantin, który wyjaśnił nam, że jest to pierwszy z kilku projektów programistycznych związany z językiem keczua, takich jak aplikacja z funkcją “text-to-voice”, która potrafi automatycznie przetwarzać tekst na mowę (dotyczy odmiany z Cusco), internetowy korektor pisowni, czy wtyczka do edytora tekstu LibreOffice.

Głównym zadaniem projektu dotyczącego aplikacji “text-to-voice” jest przetwarzanie za pomocą odtwarzacza frazy lub słowa dnia w języku keczua na mowę, a następnie publikacja uzyskanego w ten sposób nagrania na serwisach społecznościowych. Na profilu projektu na Instagramie wraz ze słowem dnia udostępniane są także obrazki oraz odpowiedniki w różnych językach. Nagrania są także dostępne na platformie SoundCloud.

Natomiast na tym wideo z platformy YouTube Hinantin uczy, jak poprawnie wymawiać słowo maywa oznaczające “fioletowy”:

Program został stworzony na podstawie korpusu (zbioru) tekstów i próbek mowy dla języka keczua. Projekt skupia się na dialektach Cusco, Puno i Lima, jako że tłumacze odpowiedzialni za ten etap przedsięwzięcia pochodzą właśnie z tych regionów. Każda osoba użyczająca swojego głosu w nagraniach mówi w używanej przez siebie odmianie, jednak system pisma używany w plikach wideo i podcastach należy do dialektu południowego.

Wszyscy tłumacze mogą korzystać z wybranego przez siebie systemu, ponieważ teksty wprowadzane do programu automatycznie przybierają postać południowej odmiany keczua. Uczestnicy projektu porównują tłumaczenia z dostępnymi tłumaczami automatycznymi w celu wykrycia ewentualnych błędów i dostrzeżenia zalet nagrań wykonanych w ramach przedsięwzięcia.

Jednym z przeznaczeń korpusu tekstów i próbek mowy jest nauka języka keczua poprzez platformę elektroniczną RunaSimi. Z tego względu, osoby pracujące przy projekcie stworzyły podgrupę korpusu tekstowo-dźwiękowego.

Grupa Hinantin bierze także czynny udział w rozwoju innych programów wspierających lokalne języki, takie jak keczua, asháninka, czy ajmara.

Ponieważ takie języki są częścią peruwiańskiego dziedzictwa kulturowego, ich ocena oraz użycie są nieodłączną częścią polityki promocji różnorodności i wymiany międzynarodowej. Szacuje się, że w kraju funkcjonuje obecnie ponad 50 żywych języków rodzimych, a także wiele innych, które są już uważane za wymarłe. Peruwiańskie Ministerstwo Kultury opracowało Narodowy Dokument Języków Rodzimych z oficjalnymi danymi dotyczącymi poszczególnych języków oraz ich użytkowników. Zawiera on także informacje o miejscach, w których można się ich nauczyć, a także mapę ze statystykami przedstawiającą ich nagrania.

Rozpocznij dyskusję

Autorzy, proszę Zaloguj »

Wskazówki

  • Wszystkie komentarze są moderowane. Nie wysyłaj komentarza więcej niż raz, gdyż może to zostać zinterpretowane jako spam.
  • Prosimy, traktuj innych z szacunkiem. Komentarze nieprzywoite, obraźliwe lub atakujące inne osoby nie będą publikowane.