Saat Ini ChatGPT Bisa Bersuara, Mengenali Gambar, dan Mendengar

JABAR EKSPRES- Kemajuan dalam bidang AI semakin mengagumkan, terutama dalam pengembangan ChatGPT oleh OpenAI. Sekarang, AI tersebut tidak hanya dapat berinteraksi dalam bentuk teks, tetapi juga mampu berbicara dan mengenali gambar.

OpenAI mengumumkan peluncuran kemampuan baru ChatGPT ini secara resmi di situs web mereka pada hari Selasa. Dalam perkembangan ini, ChatGPT sekarang dapat berkomunikasi melalui suara dan mengenali gambar, membuka jalan bagi antarmuka yang lebih intuitif bagi penggunanya, baik dalam percakapan suara maupun dalam memberikan instruksi melalui gambar.

Dengan kemampuan suara dan gambar ini, pengguna dapat memanfaatkan ChatGPT dalam berbagai aspek kehidupan sehari-hari. Misalnya, pengguna dapat mengambil foto isi lemari es dan dapur, dan ChatGPT akan membantu menentukan menu makan malam. Setelah makan malam, pengguna bahkan dapat menggunakan gambar soal matematika anak mereka, menggarisinya, dan meminta ChatGPT memberikan panduan untuk menemukan jawaban.

Interaksi dengan Artifial Intelegent melalui suara juga dapat dilakukan dengan mudah. Pengguna hanya perlu membuka Pengaturan di aplikasi seluler, memilih Fitur Baru, dan mulai berbicara dengan ChatGPT. Ada pilihan lima suara berbeda yang dapat dipilih.

 

Baca juga: Realme Akan Produksi HP dengan Fitur Kamera Telefoto Periskop?

Baca juga: Google Bard AI Punya Fitur Baru! Bisa Terhubung ke Produk Google Lainnya

 

Kemampuan suara ini didukung oleh model text-to-speech yang baru, yang mampu menghasilkan audio yang sangat menyerupai suara manusia dari teks dan contoh ucapan singkat. OpenAI juga telah bekerja sama dengan para profesional pengisi suara untuk menciptakan setiap suara, dan mereka menggunakan sistem pengenalan ucapan sumber terbuka bernama Whisper untuk mengonversi ucapan menjadi teks.

Selain kemampuan suara, ChatGPT juga memiliki kemampuan untuk berinteraksi dengan gambar. Pengguna dapat mengambil atau memilih gambar dan berdiskusi dengannya. Pemahaman gambar ChatGPT didukung oleh multimodal GPT-3.5 dan GPT-4, yang memungkinkan ChatGPT untuk menganalisis berbagai jenis gambar, termasuk foto, tangkapan layar, dan dokumen yang mengandung teks dan gambar.

Meskipun demikian, OpenAI telah membatasi kemampuan ChatGPT dalam menganalisis dan membuat pernyataan langsung tentang individu tertentu, mengakui bahwa ChatGPT tidak selalu akurat, dan menghormati privasi individu adalah prioritas utama.

Berita Terkait

Tinggalkan Balasan