AnakStartup.id – CEO Mark Zuckerberg pada Jum’at (24/02/23) mengumumkan bahwa tim Fundamental AI Research (FAIR) di Meta, perusahaan induk Facebook, telah mengembangkan sebuah model bahasa kecerdasan buatan (AI) “canggih” baru yang disebut Large Language Model Meta AI (LLaMA).
Model ini akan tersedia untuk para peneliti dan diharapkan dapat membantu ilmuwan dan insinyur saat mereka mengeksplorasi penggunaan baru AI.
Mark Zuckerberg menulis dalam sebuah posting Facebook bahwa Meta telah merilis model bahasa kecerdasan buatan yang besar dan canggih yang disebut LLaMA, yang dirancang untuk membantu para peneliti dalam mengembangkan pekerjaan mereka.
Menurut Zuckerberg, LLaMA telah menunjukkan banyak kemajuan dalam menghasilkan teks, melakukan percakapan, meringkas materi tertulis, serta menyelesaikan tugas yang lebih kompleks seperti memecahkan teorema matematika atau memprediksi struktur protein.
Kemajuan AI telah menjadi fokus bagi perusahaan teknologi besar dan startup, dan model bahasa besar seperti Bing AI Microsoft, ChatGPT OpenAI, dan AI Bard Google yang belum dirilis membantu mendukung aplikasi.
Meta mengklaim bahwa ada beberapa perbedaan antara LLM Meta dengan model lain, terutama dalam hal ukuran dan keterbukaannya terhadap peneliti.
Apa itu LLaMA?
LLaMA sebenarnya bukanlah sebuah chatbot; ia adalah sebuah alat penelitian yang, menurut Meta, kemungkinan akan memecahkan masalah yang berkaitan dengan model bahasa AI.
“Model yang lebih kecil dan lebih efektif seperti LLaMA memungkinkan orang-orang di komunitas penelitian yang tidak memiliki akses ke infrastruktur yang besar untuk mempelajari model-model ini, yang lebih demokratis dalam mengakses bidang penting yang cepat berubah ini,” kata Meta dalam blog resminya.
LLaMA akan memiliki 7-65 miliar parameter
Meta AI mengungkapkan bahwa LLaMA akan memiliki 7-65 miliar parameter, yang menurut mereka cukup besar untuk membantu para peneliti dalam mengeksplorasi penggunaan baru AI.
Meskipun model yang lebih besar telah terbukti dapat memperluas kemampuan teknologi, namun mereka lebih mahal untuk dioperasikan, terutama dalam tahap “inferensi”. Contohnya, Chat-GPT 3 dari OpenAI memiliki 175 miliar parameter.
Meta AI menjelaskan bahwa model yang lebih kecil yang dilatih dengan lebih banyak token (potongan kata) lebih mudah untuk dilatih ulang dan disesuaikan untuk kasus penggunaan produk tertentu. Hal ini dijelaskan dalam posting blog Meta AI pada hari Jumat.
Baca juga: Facebook Ganti Nama Jadi Meta. Apa Alasannya?
Dekripsi Model Bahasa Besar
Model bahasa besar atau LLM adalah sistem AI yang mengonsumsi volume besar teks digital dari sumber internet seperti artikel, laporan berita, dan posting media sosial.
Teks digital ini digunakan untuk melatih perangkat lunak yang memprediksi dan menghasilkan konten dari awal berdasarkan prompt dan kueri.
Model-model ini dapat membantu dalam tugas-tugas seperti menulis esai, menghasilkan posting media sosial, memberikan kode pemrograman yang disarankan, dan menghasilkan percakapan chatbot.
Halusinasi AI – tidak ada jaminan
Seperti model bahasa besar lainnya, LLaMA digunakan untuk menghasilkan teks secara rekursif dengan memprediksi istilah berikutnya menggunakan urutan kata sebagai masukan.
Meta AI mengklaim telah menggunakan literatur dari 20 bahasa yang paling banyak digunakan oleh penutur, dengan fokus pada bahasa yang menggunakan alfabet Latin dan Cyrillic untuk melatih modelnya.
Namun, seperti halnya dengan model bahasa besar lainnya, Meta AI belum memberikan jaminan bahwa LLaMA tidak akan mengalami halusinasi.
Dalam blognya, Meta AI mengatakan bahwa masih ada penelitian lebih lanjut yang perlu dilakukan untuk mengatasi risiko bias, komentar beracun, dan halusinasi dalam model bahasa besar.
Oleh karena itu, LLaMA juga menghadapi tantangan yang sama seperti model bahasa besar lainnya.
Meta pernah menjadi salah satu yang pertama merilis chatbot miliknya sendiri. Namun, karena hasil yang tidak akurat dan respons yang kurang memuaskan, rencana mereka menjadi tidak berjalan dengan baik. Dengan LLaMA, Meta tampaknya kembali memasuki permainan tersebut.