NVIDIA gunakan video Netflix dan YouTube secara ilegal untuk kembangkan AI
Seorang mantan karyawan NVIDIA membeberkan perusahaan tersebut gunakan video dari Netflix dan YouTube secara ilegal untuk mengembangkan proyek AI bernama proyek Cosmos.
NVIDIA kembali mendapatkan kabar yang kurang menyenangkan. Setelah sebelumnya mereka disebut-sebut mengambil data subtitle dari YouTube, kini seorang mantan karyawan dari perusahaan tersebut kembali menghadirkan fakta yang lebih mencengangkan.
Ternyata, bukan hanya mengambil data dari YouTube tanpa pengetahuan pemilik perusahaan tersebut. Melainkan perusahaan tersebut juga disebut mengambil data dari Netflix tanpa diketahui oleh pihak manapun.
Sang mantan karyawan tersebut mengatakan bahwa NVIDIA menggunakan data tersebut untuk “menghasilkan pengalaman visual seumur hidup manusia yang bernilai data pelatihan per hari” untuk proyek bernama Cosmos. Hal ini juga sebelumnya sudah terungkap melalui bocoran obrolan internal Slack, email, dan dokumen yang didapatkan 404 Media, seperti dilansir dari laman Digitaltrends (6/8).
Para karyawan perusahaan perangkat keras asal Amerika tersebut diminta untuk mengambil konten video dari Netflix, YouTube, dan sumber daring lainnya untuk mendapatkan data pelatihan guna digunakan dengan berbagai produk AI milik perusahaan.
Data tersebut meliputi generator dunia Omniverse 3D milik NVIDIA, sistem mobil tanpa pengemudi, dan "manusia digital".
Ketika karyawan tersebut bertanya tentang legalitas proyek tersebut, yang secara internal diberi nama Cosmos, mereka diyakinkan oleh manajemen bahwa mereka telah diberi izin oleh petinggi perusahaan untuk menggunakan konten tersebut.
Proyek ini berupaya membangun model fondasi, mirip dengan Gemini 1.5, GPT-4, atau Llama 3.1, “yang merangkum simulasi transportasi ringan, fisika, dan kecerdasan di satu tempat untuk membuka berbagai aplikasi hilir yang penting bagi NVIDIA.”
Sementara untuk pelaksanaan pengambilan data ini, proyek Cosmos diduga menggunakan pengunduh video sumber terbuka dan menggunakan pembelajaran mesin untuk berpindah IP. Jadi ini membuat YouTube kesulitan untuk melakukan pemblokiran.
Menurut email yang dilihat oleh 404, manajer proyek membahas penggunaan sebanyak 30 mesin virtual yang berjalan di Amazon Web Services untuk mengunduh video berdurasi penuh dan klip yang sama dengan 80 tahun setiap hari.
Sementara itu, NVIDIA tidak mengklaim melakukan kesalahan. “Kami menghormati hak semua kreator konten dan yakin bahwa model dan upaya penelitian kami sepenuhnya mematuhi hukum hak cipta,” kata juru bicara NVIDIA kepada 404 Media.
“Hukum hak cipta melindungi ekspresi tertentu, tetapi bukan fakta, ide, data, atau informasi. Siapa pun bebas mempelajari fakta, ide, data, atau informasi dari sumber lain dan menggunakannya untuk membuat ekspresi mereka sendiri. Penggunaan wajar juga melindungi kemampuan untuk menggunakan suatu karya untuk tujuan transformatif, seperti pelatihan model,” kata perwakilan NVIDIA.