Mantis, solusi anti serangan AI berbasis LLM

Oleh: Ahmad Haikal - Kamis, 21 Nov 2024 15:41 WIB

Peneliti Universitas George Mason menciptakan inovasi pertahanan berbasis AI yang menggunakan serangan injeksi prompt untuk melumpuhkan model AI penyerang.

Dalam menghadapi ancaman yang terus berkembang dari penggunaan model bahasa besar (LLM) oleh pelaku siber, peneliti dari Universitas George Mason memperkenalkan Mantis. Mantis merupakan sebuah sistem pertahanan berbasis AI yang dirancang untuk menumbangkan AI generatif yang digunakan oleh penyerang melalui teknik serangan injeksi prompt, menjadikannya langkah baru yang signifikan dalam keamanan dunia maya.

Selain melakukan perlindungan, Mantis juga melakukan pemalsuan layanan target dan mengirimkan respons balik yang berisi perintah tersembunyi. Mantis menyisipkan serangan injeksi prompt ke dalam simulasi layanan seperti halaman login palsu atau server FTP.

Dengan respons manipulatif ini, Mantis tidak hanya memperlambat serangan, tetapi juga memanfaatkan kelemahan mendasar dalam desain LLM untuk menyerang balik.

Penelitian menunjukkan bahwa Mantis memiliki tingkat keberhasilan lebih dari 95% dalam memperlambat atau mengalihkan serangan. Kelemahan mendasar dalam kerentanan injeksi prompt sulit diperbaiki, menjadikan teknik ini senjata ampuh dalam melindungi sistem. “Kami mengeksploitasi kelemahan yang sangat sulit untuk diatasi,” jelas Giuseppe Ateniese, profesor keamanan siber di Universitas George Mason.

LLM seperti ConfusedPilot dan CodeBreaker digunakan untuk mengotomatisasi pembuatan kode berbahaya dan eksploitasi celah keamanan dengan efisiensi yang tinggi. Namun, keberadaan Mantis menjadi penghalang bagi otomatisasi serangan siber.