Generative AI, seperti yang digunakan dalam platform seperti ChatGPT, menjadi semakin terintegrasi dengan berbagai basis data korporat. Namun, penelitian baru menunjukkan bahwa alat-alat ini cenderung tidak akurat dan semakin sulit dipahami.
Studi dari Stanford University menyoroti bahwa Large Language Models (LLMs), dasar algoritma untuk alat generative AI, menjadi tidak akurat ketika terhubung ke basis data korporat dan semakin kurang transparan. Seiring dengan peningkatan ukuran dan kompleksitas LLMs, sulit untuk melacak sumber data yang digunakan, menyulitkan bisnis untuk membangun aplikasi yang menggunakan model dasar genAI secara aman.
Ketidakakuratan ini juga menjadi hambatan bagi regulator dan pembuat kebijakan untuk merumuskan kebijakan yang efektif terhadap teknologi ini. Selain itu, sulit bagi konsumen untuk memahami batasan model atau mencari tanggung jawab atas kerugian yang disebabkan.
Sebagai respons, Stanford menciptakan Foundation Model Transparency Index (FMTI) yang mengevaluasi tingkat transparansi dari 10 LLMs. Hasilnya menunjukkan bahwa skor transparansi rata-rata hanya mencapai 37%, dengan LLaMA mencetak skor tertinggi 52%, diikuti oleh GPT-4 dan PaLM 2.
Ketidaktransparanan bukan hanya masalah dengan LLMs, tetapi juga keakuratannya. Sebuah studi menggunakan data perusahaan asuransi menunjukkan bahwa LLMs hanya memberikan jawaban yang akurat untuk pertanyaan dasar bisnis sebesar 22%, dan untuk pertanyaan tingkat lanjut, akurasinya turun menjadi 0%.
Masalah ini menciptakan kekhawatiran dalam penggunaan genAI di dunia bisnis, dengan 59% dari eksekutif mengungkapkan keprihatinan mendalam terkait risiko keamanan yang dapat membahayakan informasi perusahaan dan mengakibatkan kehilangan kendali fungsi bisnis inti.
Para peneliti menyarankan bahwa untuk meningkatkan akurasi respons dari LLMs, perusahaan perlu memiliki dasar data yang kuat dan mengggunakan pendekatan seperti Knowledge Graph representation dari basis data SQL perusahaan. Langkah-langkah ini bertujuan untuk meningkatkan keakuratan respons dan memastikan adanya penjelasan yang dapat dipahami.
Namun, tantangan tetap ada, dan seiring dengan peningkatan penggunaan genAI di bisnis, penting untuk terus melakukan riset, mengembangkan kebijakan yang bijaksana, dan menjaga keseimbangan antara produktivitas dan keamanan informasi yang sensitif.