Google Tertantang Pelajari Bahasa Jawa
- Viva.co.id/Agus Tri Haryanto
VIVA.co.id – Fasilitas yang disediakan oleh Google yaitu Text-To-Speech hanya menggunakan bahasa Indonesia. Namun ke depannya Text-To-Speech dapat menggunakan Untuk mengembangkan aplikasi tersebut, Google bekerja sama dengan Universitas Gadjah Mada (UGM) mengembangkan aplikasi Text-To-Speech (TTS) bahasa Jawa sebagai bagian dari riset mereka yang diberi nama Project Unison.
Melalui kerja sama ini, UGM akan memfasilitasi proses pengumpulan rekaman tuturan untuk membangun data base yang diperlukan untuk aplikasi tersebut.
“Sangat penting bagi kami untuk bekerja sama dengan universitas karena proses pengumpulan data, khususnya untuk bahasa-bahasa daerah, memang sangat sulit sehingga tidak dapat kami kerjakan sendiri,” ujar Senior Program Manager Google Research for Low Resource Languages, Linne Ha, dalam Seminar Digitalisasi Bahasa Jawa dengan Google ASR dan TTS, di UGM, Rabu 4 Mei 2016.
Project Unison merupakan riset yang dimulai Google pada 2015 untuk mengeksplorasi pendekatan inovatif dalam mengembangkan aplikasi Text-To-Speech untuk bahasa-bahasa yang dikategorikan sebagai low resource language. Bahasa yang termasuk dalam kategori ini yaitu berbagai bahasa daerah yang ada di dunia. Di Indonesia, bahasa Jawa menjadi bahasa daerah pertama yang akan dilakukan digitalisasi, mengingat penuturnya yang terbilang cukup banyak.
Meski demikian, kata Linne, dialek yang sangat beragam menjadi tantangan tersendiri bagi pembuatan aplikasi ini.
“Keragaman dalam bahasa Jawa menjadi tantangan tersendiri. Antara penutur bahasa Jawa di daerah ini dengan daerah yang lain bisa punya dialek yang berbeda. Namun kami berusaha mengumpulkan sebanyak mungkin data untuk membangun identifikasi suara yang mampu menangkap berbagai dialek yang berbeda,” jelasnya.
Proses pengumpulan data suara dalam proyek ini tidak menggunakan cara yang biasa dilakukan, yaitu dengan melibatkan seorang voice talent serta menggunakan studio profesional. Tapi Google merekam suara dari penutur dan lingkungan yang beragam untuk menangkap berbagai dialek-dialek khas dari bahasa tersebut. Selain itu, metode ini juga digunakan untuk membuat suara yang terdengar layaknya suara manusia, tetapi tidak mudah diidentifikasi kepada seorang pribadi tertentu.
(ren)