
Logo Hinantin – projektu mającego na celu rozwój programu promującego wymierający rdzenny język keczua. Wykorzystano za zgodą właściciela.
Pewna peruwiańska grupa badawcza stworzyła aplikację z funkcją “text-to-voice” przetwarzającą tekst w języku keczua na mowę, którą potem publikuje na takich serwisach społecznościowych jak YouTube, Twitter, czy Facebook.
Grupa Hinantin z siedzibą w Cusco specjalizuje się w rozwoju badań i oprogramowania w dziedzinie lingwistyki komputerowej i pracuje obecnie nad promowaniem lokalnych języków Peru, jako że ilość osób, która się nimi posługuje, maleje.
Ekipa Global Voices rozmawiała z Richardem Castro, jednym z założycieli Hinantin, który wyjaśnił nam, że jest to pierwszy z kilku projektów programistycznych związany z językiem keczua, takich jak aplikacja z funkcją “text-to-voice”, która potrafi automatycznie przetwarzać tekst na mowę (dotyczy odmiany z Cusco), internetowy korektor pisowni, czy wtyczka do edytora tekstu LibreOffice.
Głównym zadaniem projektu dotyczącego aplikacji “text-to-voice” jest przetwarzanie za pomocą odtwarzacza frazy lub słowa dnia w języku keczua na mowę, a następnie publikacja uzyskanego w ten sposób nagrania na serwisach społecznościowych. Na profilu projektu na Instagramie wraz ze słowem dnia udostępniane są także obrazki oraz odpowiedniki w różnych językach. Nagrania są także dostępne na platformie SoundCloud.
Natomiast na tym wideo z platformy YouTube Hinantin uczy, jak poprawnie wymawiać słowo maywa oznaczające “fioletowy”:
Program został stworzony na podstawie korpusu (zbioru) tekstów i próbek mowy dla języka keczua. Projekt skupia się na dialektach Cusco, Puno i Lima, jako że tłumacze odpowiedzialni za ten etap przedsięwzięcia pochodzą właśnie z tych regionów. Każda osoba użyczająca swojego głosu w nagraniach mówi w używanej przez siebie odmianie, jednak system pisma używany w plikach wideo i podcastach należy do dialektu południowego.
Wszyscy tłumacze mogą korzystać z wybranego przez siebie systemu, ponieważ teksty wprowadzane do programu automatycznie przybierają postać południowej odmiany keczua. Uczestnicy projektu porównują tłumaczenia z dostępnymi tłumaczami automatycznymi w celu wykrycia ewentualnych błędów i dostrzeżenia zalet nagrań wykonanych w ramach przedsięwzięcia.
Jednym z przeznaczeń korpusu tekstów i próbek mowy jest nauka języka keczua poprzez platformę elektroniczną RunaSimi. Z tego względu, osoby pracujące przy projekcie stworzyły podgrupę korpusu tekstowo-dźwiękowego.
Grupa Hinantin bierze także czynny udział w rozwoju innych programów wspierających lokalne języki, takie jak keczua, asháninka, czy ajmara.
Ponieważ takie języki są częścią peruwiańskiego dziedzictwa kulturowego, ich ocena oraz użycie są nieodłączną częścią polityki promocji różnorodności i wymiany międzynarodowej. Szacuje się, że w kraju funkcjonuje obecnie ponad 50 żywych języków rodzimych, a także wiele innych, które są już uważane za wymarłe. Peruwiańskie Ministerstwo Kultury opracowało Narodowy Dokument Języków Rodzimych z oficjalnymi danymi dotyczącymi poszczególnych języków oraz ich użytkowników. Zawiera on także informacje o miejscach, w których można się ich nauczyć, a także mapę ze statystykami przedstawiającą ich nagrania.