Pewna peruwiańska grupa badawcza [1] stworzyła aplikację z funkcją “text-to-voice” [2] przetwarzającą tekst w języku keczua [3] na mowę, którą potem publikuje na takich serwisach społecznościowych jak YouTube [4], Twitter [5], czy Facebook [6].
Grupa Hinantin [7]z siedzibą w Cusco specjalizuje się w rozwoju badań i oprogramowania w dziedzinie lingwistyki komputerowej i pracuje obecnie nad promowaniem lokalnych języków Peru, jako że ilość osób, która się nimi posługuje, maleje [8].
Ekipa Global Voices rozmawiała z Richardem Castro, jednym z założycieli Hinantin, który wyjaśnił nam, że jest to pierwszy z kilku projektów programistycznych związany z językiem keczua, takich jak aplikacja z funkcją “text-to-voice” [2], która potrafi automatycznie przetwarzać tekst na mowę (dotyczy odmiany z Cusco), internetowy korektor pisowni [9], czy wtyczka do edytora tekstu LibreOffice [10].
Głównym zadaniem projektu dotyczącego aplikacji “text-to-voice” [2] jest przetwarzanie za pomocą odtwarzacza frazy lub słowa dnia w języku keczua na mowę, a następnie publikacja uzyskanego w ten sposób nagrania na serwisach społecznościowych. Na profilu projektu na Instagramie [11] wraz ze słowem dnia udostępniane są także obrazki oraz odpowiedniki w różnych językach. Nagrania są także dostępne na platformie SoundCloud [12].
Natomiast na tym wideo z platformy YouTube [13] Hinantin uczy, jak poprawnie wymawiać słowo maywa oznaczające “fioletowy”:
Program został stworzony na podstawie korpusu (zbioru) tekstów i próbek mowy dla języka keczua. Projekt skupia się na dialektach Cusco, Puno i Lima, jako że tłumacze odpowiedzialni za ten etap przedsięwzięcia pochodzą właśnie z tych regionów. Każda osoba użyczająca swojego głosu w nagraniach mówi w używanej przez siebie odmianie, jednak system pisma używany w plikach wideo i podcastach należy do dialektu południowego [14].
Wszyscy tłumacze mogą korzystać z wybranego przez siebie systemu, ponieważ teksty wprowadzane do programu automatycznie przybierają postać południowej odmiany keczua [15]. Uczestnicy projektu porównują tłumaczenia z dostępnymi tłumaczami automatycznymi [16] w celu wykrycia ewentualnych błędów i dostrzeżenia zalet nagrań wykonanych w ramach przedsięwzięcia.
Jednym z przeznaczeń korpusu tekstów i próbek mowy jest nauka języka keczua poprzez platformę elektroniczną RunaSimi [17]. Z tego względu, osoby pracujące przy projekcie stworzyły podgrupę [18] korpusu tekstowo-dźwiękowego.
Grupa Hinantin bierze także czynny udział w rozwoju innych programów wspierających lokalne języki, takie jak keczua, asháninka, czy ajmara.
Ponieważ takie języki są częścią peruwiańskiego dziedzictwa kulturowego [19], ich ocena oraz użycie są nieodłączną częścią polityki promocji różnorodności i wymiany międzynarodowej. Szacuje się, że w kraju funkcjonuje obecnie ponad 50 żywych języków rodzimych [20], a także wiele innych, które są już uważane za wymarłe. Peruwiańskie Ministerstwo Kultury opracowało [21] Narodowy Dokument Języków Rodzimych z oficjalnymi danymi dotyczącymi poszczególnych języków oraz ich użytkowników. Zawiera on także informacje o miejscach, w których można się ich nauczyć, a także mapę ze statystykami [22] przedstawiającą ich nagrania.