Teknologi Kloning Suara Jadi Favorit Penjahat Siber

Ilustrasi kejahatan siber.
Sumber :
  • Istimewa
Tim Heller
Tim Heller adalah seorang artis sulih suara dan aktor.

Kian hari, teknologi kloning suara jadi lebih efektif. Teknologi itu yang kian diminati para aktor dan penjahat siber.

Ketika Tim Heller kali pertama mendengar suaranya dari hasil kloningan, dia mengakuinya begitu akurat hingga membuat "rahangku menganga hingga ke lantai...itu mengejutkan?

Kloning suara berasal dari suatu program komputer yang digunakan untuk menghasilkan salinan suara seseorang yang sintetis dan dapat disesuaikan.

Cukup dari rekaman pembicaraan seseorang, piranti lunak itu mampu untuk mereplikasi suara orang itu untuk mengucapkan beberapa kata atau kalimat yang diketik dari keyboard.

Seperti itulah kemajuan terbaru dalam teknologi sehingga audio yang dihasilkan komputer sekarang kiat akurat.

 

Piranti itu tidak saja dapat mereka aksen suara, namun juga getaran, nada, kecepatan, aliran bicara, dan pernapasan Anda.

Suara kloningan itu pun dapat diubah untuk menggambarkan emosi apa pun yang diperlukan - seperti kemarahan, ketakutan, kebahagiaan, cinta, atau kebosanan.

Sebagai artis sulih suara dan aktor asal Texas berusia 29 tahun, Heller bisa melakoni karakter kartun, narator buku audio dan dokumenter, bicara di gim video, menyulih suara trailer film.

Dia mengaku baru-baru ini beralih ke kloning suara demi melapangkan masa depan kariernya.

Menurut teknologi itu bisa membuat dia mendapat lebih banyak pekerjaan. Contohnya, bila mendapat dua pesanan dalam waktu yang sama, dia bisa mengirim kloningan suaranya ke salah satu pesanan itu.

"Bila saya dapat pesanan untuk kerjaan lain...saya bisa gunakan `dubbingan saya` [sebuatannya untuk suara hasil kloningan] sebagai opsi yang bisa menghemat waktu para klien dan bisa mendapatkan pasukan pasif bagi diri saya," kata Heller.

Untuk bisa mengkloning suaranya, Heller ke suatu jasa yang berbasis di Bosto bernama VocaliD - yang termasuk salah satu penyedia jasa kloning suara yang mulai tumbuh bertebaran.

VocaliD didirikan oleh mantan CEO-nya, Rupal Patel, yang kini menjadi profesor ilmu komunikasi di Northeastern Universirty.

Patel mendirikan bisnis itu pada 2014 sebagai kepanjangan tangan bisnisnya yang menciptakan suarta buatan bagi pasien yang tidak bisa bicara tanpa adanya asiten, atau mereka yang kehilangan suara usai bedah medis atau karena sakit.

Rupal Patel
Akademisi AS, Profesor Rupal Patel, merupakan pakar dalam teknologi kloning suara.

Menurut dia, teknologi itu - yang dipimpin oleh kecerdasan buatan, yaitu pirantu lunak yang bisa "belajar" dan beradaptasi sendiri - telah mengalami kemajuan besar dalam beberapa tahun terakhir. Ini yang menarik perhatian para artis sulih suara.

"Kami juga menspesialisasi pembuatan suara-suara rekayasan yang aksennya lebih beragam," kata Profesor Patel.

"Kami telah membuat suara transpuan, juga suara gender yang netral...teknologi harus berbicara seperti kita semua berbicara, kita semua memiliki aksen dan suara yang unik."

Kloning suara juga bisa digunakan untuk menerjemahkan kata-kata seorang aktor ke beberapa bahasa yang berbeda.

Ini bisa berpotensi membuat, sebagai contoh, perusahaan produksi film Amerika tidak akan perlu lagi merekrut aktor tambahan untuk sulih suara yang beragam dalam peredaran film mereka di mancanegara.

Perusahaan asal Kanada, Resemble AI, mengaku bisa mengkloning suara berbahasa Inggris ke 15 bahasa lain.

CEO perusahaan itu, Zohaib Ahmed, mengatakan bahwa untuk mendapatkan salinan suara seseorang yang berkualitas, piranti lunak it perlu rekaman seseorang yang berbicara minimal 10 menit.

Zohaib Ahmed
Perusahaan yang dikelola Zohaib Ahmed bisa mengubah suara seseorang ke dalam beberapa bahasa.

"Saat pelajari suara Anda, kecerdasan buatan itu mempelajari banyak aspek seperti getaran, nada, dan intensitas," katanya.

"Selain itu juga mempelajari ribuan fitur lain [dari suara orang yang bersangkutan] yang mungkin tidak begitu jelas terdengar bagi kita."

Kecanggihan teknologi kloning suara di satu sisi memang punya potensi komersial.

Namun, di sisi lain, mengundang kekhawatiran bahwa teknologi ini bisa digunakan dalam kejahatan siber - yaitu mengelabui orang bahwa seakan-akan ada orang lain berbicara.

Bersama dengan video palsu buatan komputer, kloning suara juga bisa disebut "deepfake."

Pakar keamanan siber Eddy Bobritsky mengatakan ada "risiko keamanan yang besar" dari suara sintetis tersebut.

"Saat muncul email atau pesan tertulis, sudah diketahui selama bertahun-tahun bahwa itu cukup mudah untuk meniru orang lain," kata bos perusahaan Minerva Labs asal Israel itu.

"Sedari dulu, berbicara lewat telepon dengan seseorang yang Anda percaya dan kenal betul merupakan satu dari cara paling umum untuk meyakinkan Anda memang familiar dengan orang itu."

Namun Bobritsky mengatakan eranya kini sudah berubah. "Contohnya, bila seorang bos menelpon bawahannya untuk menanyakan informasi yang sensitif, lalu stafnya mengenali suara itu, dan langsung merespons seperti yang diminta. Itu merupakan celah bagi banyak kejahatan siber."


BBC

New Tech Economy merupakan serial yang mengeksplorasi bagaimana inovasi teknologi dibuat untuk membentuk lanskap ekonomi baru.


Nyatanya, sudah ada kasus yang dilaporkan Wall Street Journal pada 2019. Seorang manajer asal Inggris saat itu jadi korban penipuan setelah mentransfer lebih dari Rp4,4 miliar kepada penipu yang menggunakan kloningan suara bos sang korban asal Jerman.

"Langkah-langkah untuk menghadapi teknologi ini dan ancaman yang ditimbulkan perlu segera dibuat," kata Bobritsky.

Para perusahaan teknologi di seluruh dunia nyatanya sudah melakukan hal itu, seperti dilaporkan seorang spesialis kecerdasan buatan dari web berita Venture Beat.

Perusahaan-perusahaan itu bisa memonitor audio untuk memastikan apakah itu palsu, dengan mencermati tanda-tanda seperti pengulangan, kebisingan digital, dan penggunaan frasa atau kata-kata tertentu.

Sejumlah pemerintah dan badan penegak hukum juga mulai memperhatikan masalah itu.

Tahun lalu, badan penegak hukum Uni Eropa, Europol, mendesak negara-negara anggota untuk membuat "investasi secara signifikan" dalam teknologi yang bisa mendeteksi deep fake. Di AS, California telah melarang kloning suara dalam kampanye politik.

Kembali ke Texas, Tim Heller mengaku belum menjual suara kloningannya. Namun, "beberapa klien sudah berminat."

Tim Heller
Tim Heller mengaku berapa bayaran yang akan dia dapat untuk kloningan suaranya merupakan masalah baru.

Namun, apakah dia khawatir bahwa dalam jangka panjang dia bisa kehilangan pekerjaan karena suara sintetis dari orang lain?

"Saya tidak khawatir itu bisa membuat saya kehilangan pekerjaan," ujarnya. "Saya sungguh-sungguh merasa selalu akan ada tempat untuk suara manusia sungguhan.

Inti menggunakan `dubbingan` [kloning suaranya] bukan untuk menggantikan saya atau orang lain, namun berguna sebagai alat tambahan dalam bisnis saya."

Rebecca Damon, wakil presiden eksekutif dari serikat aktor AS, The Scree Actors Guild, mengatakan bahwa isu penting lainnya seputar kloning suara adalah artis sulih suara selama dibayar dengan layak.

"Kloning suara bisa mewakili industri baru yang menarik dan berpotensi besar bagi para anggota kami untuk terlibat," ujarnya. "Penting juga bagi kami bahwa pelaku sulih suara digaji dengan layak dan menyadari bagaimana suara mereka digunakan."

"Untuk tujuan demikian, kami memantau perkembangan kloning suara secara cermat, dan bekerja sama dengan para anggota untuk mengidentifikasi batasan-batasan yang dapat diterapkan dalam teknologi ini untuk mencapai potensinya sebagai bidang kerja yang baru dan disambut baik."

Heller menambahkan bahwa masalah seputar menetapkan tarif untuk kloning suara merupakan hal yang perlu segera ditangani.

"Hal terpenting menurut saya adalah saat menentukan tarif dan negosiasi kontrak [untuk suara buatan milik Anda] yaitu jangan menyerahkan semua hak cipta dan penggunaannya untuk jangka waktu tak terbatas," ujarnya.

Laporan tambahan oleh Will Smale