TECH NEWS

OpenAI dikabarkan menggunakan lebih dari satu juta jam video YouTube untuk melatih AI buatannya

OpenAI dikabarkan menggunakan transkripsi lebih dari satu juta jam video YouTube untuk melatih model bahasa besar AI tercanggihnya saat ini, yakni GPT-4. Melansir dari laporan Neowin, hal tersebut diungkapkan oleh New York Times yang menyebutkan bahwa OpenAI mengembangkan model transkripsi audio bernama Whisper yang membantu perusahaan teknologi tersebut untuk mengumpulkan data dari video YouTube. Meskipun mereka menyadari tindakan ini berada di bawah pengawasan, OpenAI tetap melanjutkan praktik tersebut karena dianggap sebagai tindakan yang wajar. Google juga menggunakan video YouTube untuk melatih model AI buatan mereka, dan CEO YouTube Neal Mohan mengklaim bahwa video yang digunakan telah mengantongi izin dari kreatornya.

Penggunaan data video YouTube oleh OpenAI untuk melatih model AI memang menimbulkan kontroversi. Berikut beberapa tanggapan masyarakat terhadap praktik ini:

  1. CEO YouTube, Neal Mohan: Menegaskan bahwa menggunakan video YouTube untuk melatih model AI seperti Sora akan melanggar syarat penggunaan platform. Kreator konten berhak atas karya mereka dan mengharapkan platform dihormati.
  2. Industri AI dan Isu Hak Cipta: Debat tentang jenis konten yang digunakan perusahaan teknologi untuk melatih model AI semakin memanas. Seniman dan kreator berpendapat bahwa karya berhak cipta mereka tidak boleh digunakan tanpa izin.
  3. Google: Google (yang memiliki YouTube) juga menggunakan beberapa video YouTube untuk melatih platform AI mereka, Gemini, tetapi hanya jika pembuat konten menyetujui hal itu dalam kontrak mereka.

Penggunaan data tanpa izin dan pelanggaran terhadap platform merupakan isu serius yang memunculkan ketidakpastian di industri AI. Menghormati hak cipta dan kebijakan penggunaan data menjadi semakin penting dalam konteks kebebasan informasi dan privasi.

OpenAI telah menghadapi kritik terkait penggunaan data video YouTube untuk melatih model AI mereka, terutama Sora, yang merupakan generator teks-ke-video terbaru. Berikut adalah beberapa tanggapan dan kontroversi yang muncul:

  1. CEO YouTube, Neal Mohan: Mohan menegaskan bahwa menggunakan video YouTube untuk melatih Sora akan melanggar syarat penggunaan platform. Ia menekankan bahwa kreator konten berhak atas karya mereka dan mengharapkan platform dihormati. Hingga saat ini, OpenAI belum sepenuhnya transparan mengenai pelatihan model AI mereka.
  1. Google: Sebagai pesaing OpenAI, Google tampaknya lebih menghormati aturan. Model AI Google, Gemini, hanya menggunakan video tertentu dengan izin dari kreator konten.
  1. Ketidakpastian dan Kontroversi: Cara OpenAI melatih Sora, bersama dengan ChatGPT dan DALL-E, masih menyelimuti ketidakpastian dan kontroversi. Laporan terbaru dari The Wall Street Journal menyebutkan bahwa OpenAI berencana menggunakan transkripsi video YouTube untuk melatih GPT-5.

Penggunaan data tanpa izin dan pelanggaran terhadap platform merupakan isu serius yang memunculkan ketidakpastian di industri AI. Menghormati hak cipta dan kebijakan penggunaan data menjadi semakin penting dalam konteks kebebasan informasi dan privasi.

Tinggalkan Balasan

Eksplorasi konten lain dari Gakniat

Langganan sekarang agar bisa terus membaca dan mendapatkan akses ke semua arsip.

Lanjutkan membaca