Sebelum Covid, Google merilis model MEENA yang, dalam waktu singkat, menjadi model bahasa besar (large language model) terbaik di dunia. Postingan blog dan paper yang ditulis oleh Google sedikit lucu, karena secara khusus membandingkannya dengan OpenAI.
Namun, peluncuran ChatGPT pada tahun lalu memang mengguncang internal Google. Chatbot populer ini memberikan ancaman serius terhadap bisnis perusahaan sehingga Google harus mendeklarasikan status darurat dan mulai berinvestasi untuk mengejar tren kecerdasan artifisial generatif. Hal ini tidak hanya menghasilkan rilis Google Bard, tetapi juga Gemini.
Apa Itu Google Gemini?
Gemini adalah kumpulan model bahasa besar (LLM) yang menggabungkan GPT-4 dengan teknik pelatihan yang diambil dari AlphaGo, seperti reinforcement learning dan tree search, yang berpotensi menggeser ChatGPT sebagai solusi AI generatif paling dominan di planet ini.
Berita ini datang hanya beberapa bulan setelah Google menggabungkan laboratorium AI Brain dan DeepMind untuk membuat tim penelitian baru bernama Google DeepMind, dan hanya beberapa bulan setelah peluncuran Google Bard dan LLM generasi berikutnya, PaLM 2.
Para peneliti memperkirakan bahwa pasar AI generatif akan bernilai $1,3 triliun pada tahun 2032, sehingga sangat jelas bahwa Google berinvestasi penuh dalam indsutri ini untuk mempertahankan posisinya sebagai pemimpin dalam pengembangan AI.
Semua yang Perlu Diketahui tentang Gemini
Meskipun banyak yang mengharapkan bahwa Google Gemini akan dirilis pada setidaknya akhir tahun 2023, belum banyak berita perilisan yang diketahui tentang model ini. Mundur ke bulan Mei, Sundar Pichai, CEO Google dan Alphabet, merilis postingan blog dengan tinjauan tingkat tinggi tentang LLM tersebut, menjelaskan:
“Gemini diciptakan dari awal untuk menjadi multimodel, sangat efisien dalam integrasi dan API, dan dibangun untuk memungkinkan inovasi di masa depan, seperti memory dan planning.”
Sundar Pichai juga menulis bahwa meskipun masih tahap awal, Google sudah melihat kemampuan multimodel yang mengesankan yang tidak ada pada model sebelumnya. “Saat disesuaikan dan diuji secara ketat untuk keamanan, Gemini akan tersedia dalam berbagai ukuran dan kemampuan, seperti PaLM 2,” jelasnya.
Sejak saat itu, tidak banyak yang diketahui tentang rilis Gemini secara resmi, selain wawancara CEO Google DeepMind, Demis Hassabis, dengan Wired yang menerangkan bahwa Gemini akan “menggabungkan beberapa kekuatan sistem tipe AlphaGo dengan kemampuan bahasa luar biasa dari model-model besar.”
Android Police juga mengklaim bahwa sumber anonim yang terlibat dalam produk tersebut telah memberikan informasi bahwa Gemini akan dapat menghasilkan teks dan gambar kontekstual dan akan dilatih dengan sumber-sumber seperti transkrip video YouTube.
Apakah Gemini Akan Mengalahkan ChatGPT?
Salah satu pertanyaan terbesar seputar peluncuran Gemini adalah apakah model bahasa misterius ini memiliki kemampuan canggih untuk menggantikan ChatGPT, yang tahun ini mencapai lebih dari 100 juta pengguna aktif bulanan.
Sekilas, kemampuan Gemini untuk menghasilkan teks dan gambar memberinya keunggulan dibandingkan dengan GPT4 dalam hal rentang konten yang dapat dihasilkan.
Namun, mungkin perbedaan paling mencolok antara keduanya adalah berbagai data pelatihan milik Google. Google Gemini dapat memproses data yang diambil dari berbagai layanan, termasuk Google Search, YouTube, Google Books, dan Google Scholar.
Penggunaan data milik perusahaan dalam melatih model Gemini dapat menghasilkan keunggulan yang jelas dalam kompleksitas wawasan dan inferensi yang dapat diambil dari satu dataset. Ini terutama berlaku jika laporan awal yang menyebutkan bahwa Gemini dilatih dua kali lipat jumlah token daripada GPT4 adalah benar.
Selain itu, kemitraan antara tim Google DeepMind dan Brain tidak dapat diabaikan, karena ini menempatkan OpenAI berhadapan langsung dengan tim peneliti AI kelas dunia, termasuk salah satu pendiri Google, Sergey Brin, dan ahli AI senior serta pakar machine learning dari DeepMind, Paul Barham. Semuanya adalah tim berpengalaman yang memiliki pemahaman mendalam tentang bagaimana menerapkan teknik-teknik seperti reinforcement learning dan tree search untuk menciptakan program AI yang dapat mengumpulkan umpan balik dan meningkatkan kemampuan mereka dalam memecahkan masalah seiring waktu, yang tim DeepMind gunakan untuk mengajarkan AlphaGo mengalahkan juara dunia Go pada tahun 2016.
Kompetisi di Industri AI
Kemampuan multimodel Gemini, penggunaan parenting reinforcement, kemampuan generasi teks dan gambar, serta data milik Google adalah semua bahan yang diperlukan bagi Gemini untuk mengungguli GPT-4.
Data pelatihan adalah perbedaan utama, karena pada akhirnya organisasi yang menang dalam perlombaan LLM akan banyak ditentukan berdasarkan siapa yang melatih model mereka pada dataset paling besar dan paling kaya. Pertanyaannya sekarang adalah, apa yang akan dilakukan OpenAI sebagai respons?