Google I/O 2024 Pamer Fitur Baru, Semuanya AI

Kepala Eksekutif Google Sundar Pichai.
Sumber :
  • Twitter/@sundarpichai

VIVA Tekno – Google I/O adalah konferensi para developer atau pengembang teknologi yang digelar Google setiap tahun. Di acara ini, Google rutin mengenalkan sistem operasi atau OS Android versi terbaru.

Selain itu, raksasa teknologi Amerika Serikat (AS) tersebut kerap merilis perangkat teranyar dari smartphone (ponsel pintar/HP) Google Pixel.

Tapi, tahun ini elemen kecerdasan buatan atau AI bakal menjadi tema utama pada gelaran Google I/O. Google I/O 2024 resmi digelar pada Rabu dini hari, 15 Mei 2024 waktu Indonesia barat.

Kepala Eksekutif Google Sundar Pichai langsung mengumumkan sejumlah inovasi dan proyek yang akan membentuk masa depan teknologi. Salah satu topik yang paling di-highlight adalah Gemini.

Sejak diumumkan pada Google I/O 2023, Gemini terus mengalami perkembangan. Dua bulan lalu, Google memperkenalkan Gemini 1.5 Pro yang dapat menjalankan 1 juta token dalam satu kueri.

"Google sepenuhnya berada di era Gemini. Kami juga telah menghadirkan kemampuan terobosan Gemini ke seluruh produk dengan cara yang ampuh. Kami akan menampilkan contohnya di Penelusuran, Foto, Ruang Kerja, Android, dan lainnya," kata Sundar Pichai, dikutip dari YouTube Google.

Segudang fitur AI baru Google dipamerkan. Apa saja?

Project Astra

Google DeepMind mengungkapkan Project Astra, yang diharapkan dapat mengubah masa depan asisten AI dengan kemampuan pemahaman video.

Project Astra bertujuan untuk mengembangkan agen AI universal yang dapat membantu dalam kehidupan sehari-hari.

Saat demonstrasi, model penelitian ini menunjukkan kemampuannya dengan mengidentifikasi objek yang menghasilkan suara, memberikan aliterasi kreatif, menjelaskan kode pada monitor, dan menemukan barang yang terlupa.

Project Astra juga menunjukkan potensinya dalam perangkat wearable, seperti kacamata pintar, di mana ia dapat menganalisis diagram, menyarankan perbaikan, dan menghasilkan respons yang cerdas terhadap rangsangan visual.

Ke depannya, Gemini menggunakan kemampuan pemahaman video dari Project Astra untuk membentuk masa depan asisten AI.

Veo

Veo (generator teks-ke-video) dapat menghasilkan video resolusi 1080p berkualitas tinggi dengan durasi lebih dari satu menit.

Model tersebut dapat lebih memahami bahasa alami untuk menghasilkan video yang lebih mewakili visi pengguna, menurut Google.

Veo juga memahami istilah sinematik seperti "timelapse" untuk menghasilkan video dalam berbagai gaya dan memberi pengguna kontrol lebih besar atas hasil akhir.

AI di dalam Google Search

AI akan terintegrasi hampir di semua produk Google, mulai dari Search yang telah lama ada hingga Android 15. Khusus pengguna AS, kini bisa menggunakan Ikhtisar AI dalam hasil pencarian, tak terbatas pada Search Labs.

Pengguna juga bakal bisa dapat menyesuaikan Ikhtisar AI Anda dengan opsi untuk menyederhanakan bahasa atau mengelompokkannya secara lebih detail.

Ini bisa sangat berguna jika pengguna baru mengenal suatu topik, atau jika mencoba menyederhanakan sesuatu untuk memuaskan keingintahuan anak.

Google menjanjikan Ikhtisar AI bakal membantu menjawab pertanyaan yang semakin kompleks. Misalnya, mungkin kamu sedang mencari studio yoga atau pilates baru, dan kamu menginginkan studio yang populer di kalangan penduduk setempat, berlokasi strategis untuk perjalanan Anda, dan juga menawarkan diskon untuk anggota baru.

Imagen 3

Model ini menghasilkan gambar dengan kualitas terbaik, dengan lebih banyak detail dan lebih sedikit artefak dalam gambar untuk membantu menciptakan gambar yang lebih realistis.

Imagen 3 telah meningkatkan kemampuan bahasa alami untuk lebih memahami perintah pengguna dan maksud dibaliknya.

Model ini dapat mengatasi salah satu tantangan terbesar bagi generator gambar AI, yaitu teks, dan Google mengklaim Imagen 3 adalah yang terbaik untuk merendernya.

Hanya saja Imagen 3 belum tersedia secara luas, tersedia dalam pratinjau pribadi di dalam Image FX untuk pembuat tertentu.

Model ini akan segera tersedia di Vertex AI, dan masyarakat dapat mendaftar untuk bergabung dalam daftar tunggu.

SynthID

Di era AI generatif, kita melihat banyak perusahaan fokus pada multimodalitas model AI. Agar alat pelabelan AI-nya sesuai, Google kini memperluas SynthID (teknologi yang memberi watermark pada gambar AI) ke dua modalitas baru, teks dan video. Selain itu, Google bakal menerapkan watermark SynthID pada video yang dihasilkan Veo.

Ask Photos

Jika Anda pernah menghabiskan waktu berjam-jam menelusuri feed untuk menemukan gambar, Google menawarkan solusi AI untuk mengatasi masalah tersebut.

Dengan menggunakan Gemini, pengguna dapat menggunakan petunjuk percakapan di Google Foto untuk menemukan gambar yang mereka cari.

Fitur tersebut diberi nama Ask Photos. Google mengumumkan bahwa fitur tersebut akan diluncurkan akhir musim panas ini dengan lebih banyak kemampuan di masa mendatang.

Dalam contoh yang diberikan Google, pengguna ingin melihat kemajuan putri mereka sebagai perenang dari waktu ke waktu, sehingga mereka menanyakan pertanyaan tersebut kepada Google Foto, dan secara otomatis mengemas highlights untuk mereka.

Gemini

Google mengumumkan Gemini 1.5 Flash menawarkan kecepatan tinggi dan efisiensi biaya sebagai alternatif dari Gemini 1.5 Pro, sambil tetap memiliki kemampuan yang tinggi.

Sementara Gemini 1.5 Pro turut ditingkatkan guna memberikan respons yang lebih berkualitas dalam berbagai area seperti terjemahan, penalaran, pemrograman, dan lainnya.

Google mengumumkan jendela konteks sebesar 1 juta untuk Gemini Advanced, memungkinkan konsumen mendapatkan bantuan AI untuk dokumen besar seperti PDF yang panjangnya mencapai 1.500 halaman atau 100 email.

Saat ini, Google mengaku tengah mempratinjau jendela konteks sebesar dua juta untuk Gemini 1.5 Pro dan Gemini 1.5 Flash kepada pengembang melalui daftar tunggu di Google AI Studio.

Tak kalah menariknya Google mengumumkan Gemini Nano dengan Multimodalitas. Model ini dirancang untuk berjalan di smartphone dan telah diperluas untuk memahami gambar, teks dan bahasa lisan.

Bicara Gemma, keluarga model Gemini ini turut mendapatkan peningkatan besar dengan peluncuran Gemma 2 yang dioptimalkan untuk TPUs dan GPUs dengan 27B parameter. Tak hanya itu Google mengumumkan PaliGemma yang ditambahkan ke keluarga model Gemma.

AI di Android

Circle to Search yang sebelumnya hanya bisa melakukan penelusuran Google dengan melingkari gambar, video, dan teks di layar ponsel mereka, kini dapat "membantu siswa mengerjakan pekerjaan rumah".

Google mengatakan fitur tersebut akan bekerja dengan berbagai topik mulai dari matematika hingga fisika, dan pada akhirnya akan mampu memproses masalah kompleks seperti rumus simbolik, diagram, dan banyak lagi.

Gemini juga akan menggantikan Google Assistant, menjadi asisten AI default di ponsel Android dan dapat diakses dengan menekan lama tombol power.

Google mengatakan Gemini bakal diterapkan di berbagai layanan dan aplikasi, memberikan dukungan multimoda bila diminta.

Kemampuan multimodal Gemini Nano juga akan dimanfaatkan melalui fitur TalkBack Android, memberikan respons yang lebih deskriptif bagi pengguna yang mengalami kebutaan atau gangguan penglihatan.

Gemini Nano dapat mendengarkan dan mendeteksi pola percakapan yang mencurigakan dan memberi tahu pengguna untuk "Tutup & lanjutkan" atau "Akhiri panggilan". Fitur ini dijanjikan tersedia pada akhir tahun ini.

Google Workspace

Dengan semua pembaruan Gemini, Google Workspace kian terintegrasi dengan AI. Sebagai permulaan, panel samping Gemini pada Gmail, Dokumen, Drive, Slide, dan Spreadsheet akan ditingkatkan ke Gemini 1.5 Pro.

Gmail untuk seluler kini memiliki tiga fitur baru yang berguna: ringkasan, Tanya Jawab Gmail, dan Balasan Cerdas Kontekstual.

Fitur Ringkas melakukan persis seperti namanya -- fitur ini merangkum rangkaian email yang memanfaatkan Gemini. Fitur ini akan hadir kepada pengguna mulai bulan ini.

Fitur Tanya Jawab Gmail memungkinkan pengguna mengobrol dengan Gemini tentang konteks email mereka dalam aplikasi seluler Gmail.

Misalnya, dalam demo, pengguna meminta Gemini membandingkan tawaran perbaikan atap berdasarkan harga dan ketersediaan. Gemini kemudian menarik informasi dari beberapa kotak masuk berbeda dan menampilkannya kepada pengguna.