JABAR EKSPRES – Sebuah studi yang diterbitkan di Scientific Reports menemukan bahwa ketika dihadapkan dengan dilema moral, orang sering lebih memilih respons yang dihasilkan oleh kecerdasan buatan (AI) daripada yang diberikan oleh manusia. Studi ini menunjukkan bahwa orang cenderung menganggap jawaban dari AI lebih berbudi dan dapat dipercaya, yang memicu kekhawatiran tentang potensi penerimaan yang tidak kritis terhadap saran AI.
Model bahasa generatif yang canggih seperti ChatGPT telah memicu minat besar dalam kemampuannya, terutama dalam penalaran moral. Penalaran moral melibatkan penilaian kompleks tentang benar dan salah, yang tertanam dalam kognisi dan budaya manusia. Seiring AI semakin terintegrasi dalam kehidupan sehari-hari, orang semakin mungkin berkonsultasi dengannya untuk nasihat, termasuk tentang dilema moral.
“Tahun lalu, banyak dari kita yang terpesona oleh chatbot baru, seperti GPT dan lainnya, yang tampaknya mengungguli manusia dalam berbagai tugas, dan ada banyak perbincangan tentang pekerjaan apa yang akan mereka ambil selanjutnya,” jelas penulis studi Eyal. Aharoni, seorang profesor psikologi, filsafat, dan ilmu saraf di Georgia State University.
Dalam survei online terhadap 286 orang dewasa di AS, partisipan diminta mengevaluasi sepuluh pasang respons terhadap pertanyaan etis, satu dari manusia dan satu dari model bahasa GPT-4. Peserta menilai kualitas respons tanpa mengetahui sumbernya dan kemudian diberitahu salah satu respons berasal dari AI. Mereka kemudian diminta mengidentifikasi respons AI dan menilai keyakinan mereka dalam penilaian tersebut.
Baca juga: Menelusuri Hubungan Kepribadian Masa Kecil dan Niat Berwirausaha di Usia Dewasa
Hasil menunjukkan bahwa peserta umumnya menilai respons AI lebih berkualitas dibandingkan respons manusia. Respons AI dianggap lebih berbudi, dapat dipercaya, cerdas, dan rasional. Menariknya, peserta dapat membedakan respons AI sekitar 80% kasus, menunjukkan bahwa meskipun respons moral AI dianggap superior, orang masih bisa mengenali asalnya.
Indikator paling sering adalah perbedaan dalam pilihan kata dan panjang respons. Faktor lainnya termasuk emosionalitas, rasionalitas, kejelasan, dan tata bahasa.
Temuan ini menunjukkan bahwa banyak orang cukup baik dalam menebak pernyataan moral yang dihasilkan komputer, bukan karena penalaran moralnya kurang canggih, tetapi karena terlalu baik. Lima tahun lalu, tidak ada yang menyangka penalaran moral AI bisa melampaui orang dewasa berpendidikan tinggi.