Google Rilis Gemini AI, Digadang-gadang Mampu Jegal ChatGPT
- arstechnica
VIVA Tekno – Google secara resmi merilis model kecerdasan buatan (AI) yang dinamakan Gemini. AI buatan Google ini disebut-sebut mampu menyaingi, bahkan menjegal ChatGPT.
Gemini adalah model bahasa besar terbaru dari Google, yang pertama kali diumumkan oleh Pichai pada konferensi pengembang I/O pada Juni lalu dan sekarang diluncurkan untuk publik.
Menurut Pichai dan CEO Google DeepMind Demis Hassabis, ini adalah loncatan besar ke depan dalam model AI yang pada akhirnya akan memengaruhi hampir semua produk Google.
“Salah satu hal yang kuat tentang saat ini adalah Anda dapat bekerja pada satu teknologi dasar dan membuatnya lebih baik, dan itu segera mengalir ke seluruh produk kami,” kata Pichai, dikutip VIVA dari The Verge, Jumat, 8 Desember 2023.
Gemini bukan hanya satu model AI. Ada versi yang lebih ringan yang disebut Gemini Nano yang dimaksudkan untuk dijalankan secara natif dan offline pada perangkat Android.
Ada versi yang lebih kuat yang disebut Gemini Pro yang akan segera menggerakkan banyak layanan AI Google dan menjadi tulang punggung Bard.
Dan ada model yang lebih mumpuni yang disebut Gemini Ultra yang merupakan model LLM (Large Language Model) paling kuat yang pernah dibuat oleh Google dan tampaknya dirancang terutama untuk pusat data dan aplikasi perusahaan.
Google meluncurkan model ini dengan beberapa cara saat ini, Bard sekarang didukung oleh Gemini Pro, dan pengguna Pixel 8 Pro akan mendapatkan beberapa fitur baru berkat Gemini Nano, (Gemini Ultra akan datang tahun depan).
Pengembang dan pelanggan perusahaan akan dapat mengakses Gemini Pro melalui Google Generative AI Studio atau Vertex AI di Google Cloud mulai tanggal 13 Desember.
Gemini hanya tersedia dalam bahasa Inggris untuk saat ini, dengan bahasa lain yang akan segera hadir. Tetapi Pichai mengatakan model ini pada akhirnya akan diintegrasikan ke dalam mesin pencari Google, produk iklannya, peramban Chrome, dan banyak lagi, di seluruh dunia.
OpenAI meluncurkan ChatGPT setahun yang lalu, dan perusahaan serta produknya itu segera menjadi hal terbesar dalam AI. Saat ini, Google mencoba menciptakan sebagian besar teknologi dasar di balik ledakan AI saat ini, yang menyebut dirinya sebagai organisasi "AI-first" selama hampir satu dekade, dan yang jelas dan memalukan terkejut oleh seberapa bagus ChatGPT dan seberapa cepat teknologi OpenAI mengambil alih industry, akhirnya siap untuk melawan.
“Kami telah melakukan analisis yang sangat mendalam dari kedua sistem secara bersama-sama, dan pengujian benchmark,” kata Hassabis.
Kini Google menjalankan 32 benchmark yang sudah mapan yang membandingkan kedua model tersebut, mulai dari uji coba keseluruhan seperti Multi-task Language Understanding hingga uji coba yang membandingkan kemampuan dua model untuk menghasilkan kode Python.
“Saya pikir kami jauh di depan pada 30 dari 32 dari benchmark tersebut,” kata Hassabis.
“Beberapa di antaranya sangat sempit. Beberapa di antaranya lebih besar,” imbuhnya.
Dalam benchmark-benchmark tersebut (yang sebagian besar sangat mendekat), keunggulan terbesar Gemini berasal dari kemampuannya untuk memahami dan berinteraksi dengan video dan audio.
Ini sangat disengaja, multimodalitas telah menjadi bagian dari rencana Gemini sejak awal. Google tidak melatih model terpisah untuk gambar dan suara, seperti OpenAI menciptakan DALL-E dan Whisper, mereka membangun satu model multisensori dari awal.
“Kami selalu tertarik pada sistem yang sangat umum,” ujar Hassabis.
Dia terutama tertarik pada bagaimana cara menggabungkan semua mode tersebut untuk mengumpulkan sebanyak mungkin data dari sejumlah input dan indera dan kemudian memberikan respons dengan variasi yang sama.
Saat ini, model dasar Gemini adalah masukan teks dan keluaran teks, tetapi model yang lebih kuat seperti Gemini Ultra dapat bekerja dengan gambar, video, dan audio.