Microsoft Kembangkan Teknologi Mengubah Teks jadi Suara, Sama dengan Aslinya!

JABARESKPRES – Baru-baru ini microsoft telah mengembangkan teknologi AI yang dapat menirukan ucapan manusia yang sangat mirip dengan aslinya dengan nama VALL-E 2.

Dilansir dari livescine.com, Teknologi ini merupakan generator yang dapat mengubah tulisan menjadi suara ucapan yang sama persis dengan aslinya.

Menurut makalah ilmiah yang diterbitkan arXiv menyebutkan, VALL-E 2 merupakan kemajuan terbaru yang dikembangkan dengan AI yang menhasilkan bentuk suara menyerupa orang yang berbicara.

BACA LAGI: Samsung Galaxy Z Fold6 dan Galaxy Z Flip6 Hadir dengan Dukungan Teknologi AI

Namun, hasil temuan teknologi ini dikhawatirkan  disalah gunakan karena suara yang dihasilkan sangat mirip dengan aslinya.

Tidak itu saja, teknologi VALL-E 2 ini memiliki artikulasi kualitas tinggi dan dapat menirukan logat bahasa yang sulit sekalipun.

‘’Teknologi yang dikeluarkan oleh Microsoft ini menurut para peneliti sangat membahayakan sehingga dikhawatirkan akan disalah gunakan,’’ tulisnya.

Salah satu keunggulan teknologi ini adalah memiliki dua fitur utama yaitu Repetition Aware Sampling dan Grouped Code Modeling.

BACA LAGI: Galaxy S24 Series Bebaskan Berekspresi untuk Buat Konten Fashion Teknologi AI

Repetition Aware Sampling merupakan fitur yang mampu merubah teks menjadi ucapan dengan detail dan sangat akurat.

‘’fitur ini membantu memvariasikan pola ucapan VALL-E 2, membuatnya terdengar lebih lancar dan alami,’’ tulisnya lagi.

Untuk fitur Grouped Code Modeling dapat mengurangi panjang jumlah token individual yang diproses artikulasi suara sulit yang panjang.

Dalam penelitian VALL-E 2 menggunakan sample audio dari pustaka ucapan LibriSpeech dan VCTK untuk mengukur keakuratan dan kualitas ucapan.

‘’Tujuan membuat sample ini adalah untuk menguji VALL-E 2 dalam membuat ucapan yang lebih kompleks,’’ ujarnya.

BACA LAGI: Samsung Terapkan Teknologi Galaxy AI Jadikan Hidup Lebih Mudah

Dari hasi eksperimen tersebut didapatkan kualitas suara dihasilkan dari jenis paritas manusia.

Meski begitu VALL-E 2 memiliki kekurangan kualitas perintah bicara yang dipengaruhi lingkungan dan tingkat kebisingan latar belakang.

‘’Hasil temuan ini oleh Microsoft tidak akan dirilis VALL-ke publik karena potensi risiko penyalahgunaan untuk kloning suara atau teknologi deepfake,’’ tulis peneliti dalam makalanya itu. (yan)

Berita Terkait

Tinggalkan Balasan