Tantangan keakuratan AI: Google menghadapi kritik atas proses validasi Gemini
Google menghadapi tuduhan bahwa mereka menggunakan kontraktor pemula untuk mengecek kebenaran jawaban dari AI mereka, Gemini.
Google menghadapi tuduhan bahwa mereka menggunakan kontraktor pemula untuk mengecek kebenaran jawaban dari AI mereka, Gemini. Laporan ini berasal dari TechCrunch yang mengungkapkan bahwa Google telah memberikan panduan internal kepada GlobalLogic, sebuah firma outsourcing yang bertanggung jawab untuk mengevaluasi output AI, untuk tidak melewatkan prompt apapun, bahkan jika prompt tersebut memerlukan pengetahuan khusus yang kontraktor tidak miliki.
Sebelumnya, kontraktor memiliki opsi untuk melewatkan prompt yang jauh di luar bidang keahlian mereka, seperti pertanyaan hukum untuk yang tidak berprofesi sebagai pengacara. Namun, panduan baru ini mengharuskan kontraktor untuk menilai bagian-bagian dari prompt yang mereka pahami dan mencantumkan bahwa mereka tidak memiliki pengetahuan di bidang tersebut, kecuali jika ada bagian informasi yang hilang atau konten yang berbahaya yang memerlukan formulir persetujuan khusus untuk evaluasi.
Tuduhan ini menimbulkan kekhawatiran tentang akurasi dan keandalan informasi yang dihasilkan oleh Gemini. Tanpa pengevaluasi yang memiliki keahlian khusus, ada risiko peningkatan kesalahan, bias, dan informasi yang menyesatkan yang tidak terdeteksi. Ini juga dapat mengurangi kepercayaan publik terhadap teknologi AI, yang semakin diterapkan dalam berbagai aspek kehidupan sehari-hari.
Selain itu, praktik ini juga menimbulkan pertimbangan etis tentang eksploitasi kontraktor. Dengan mengharuskan mereka mengevaluasi informasi di luar keahlian mereka, Google mungkin menempatkan tekanan yang tidak perlu pada individu-individu tersebut dan mengancam kualitas kerja mereka. Praktik ini juga dapat dianggap sebagai penurunan nilai pengetahuan khusus dan keahlian dalam memastikan keakuratan sistem AI.
Google belum memberikan komentar mengenai tuduhan ini, tetapi mereka telah mempertahankan praktik evaluasi mereka sebagai proses yang multifaset dan melibatkan beberapa lapisan tinjauan, termasuk pemeriksaan otomatis dan evaluasi ahli. Namun, kritikus berpendapat bahwa bergantung pada non-ahli untuk pengecekan awal dapat memungkinkan kesalahan untuk lolos dan mengancam integritas sistem keseluruhan.