Today

Hasil Benchmark Gemini 3 Pro Bocor, Kalahkan GPT-5.1 dan Claude 4.5

Andri Hakim

Supernews.co.id-Setelah melalui masa pengembangan panjang, Google akhirnya memperkenalkan Gemini 3, generasi terbaru model kecerdasan buatan yang dirancang untuk memberikan lompatan besar dalam reasoning, multimodalitas, dan kemampuan komputasi. Seri ini menempatkan Gemini 3 Pro sebagai bintang utamanya, model yang oleh Google disebut sebagai sistem AI paling cerdas yang pernah mereka bangun hingga saat ini. Peluncuran ini menandai babak baru dalam persaingan menuju Artificial General Intelligence atau AGI.

Gemini 3 tidak hanya menjadi upgrade dari seri sebelumnya, tetapi hadir sebagai rangkaian model penalaran multimodal yang mampu memahami teks, suara, gambar, hingga video dalam satu struktur terpadu. Ambisi Google terlihat jelas: menghadirkan model AI yang tidak hanya cepat dan cerdas, tetapi juga mampu bekerja layaknya agen yang dapat merencanakan, mengeksekusi, serta memvalidasi hasil secara mandiri.

Arsitektur Baru dengan Pendekatan Sparse Mixture of Experts

Di jantung Gemini 3 Pro terdapat arsitektur sparse mixture-of-experts yang dibangun di atas Transformer. Model ini tidak mengaktifkan semua parameternya setiap kali menerima permintaan. Hanya kelompok “pakar” yang relevan untuk tugas tertentu yang akan bekerja, sehingga penggunaan komputasi menjadi jauh lebih efisien meski ukuran model sangat besar.

Pendekatan ini bertolak belakang dengan model-model padat yang banyak digunakan pesaing. Google menggambarkannya seperti organisasi besar yang hanya mengundang staf ahli untuk rapat tertentu. Seluruh proses pelatihan dilakukan di atas Tensor Processing Unit buatan Google, dengan dukungan JAX dan Pathways.

Dataset yang digunakan mencakup dokumen web, kode pemrograman, konten audio-visual, data berlisensi, konten hasil interaksi pengguna, dan materi sintetis. Sebelum masuk tahap pelatihan, seluruh data disaring untuk memastikan keamanan, kualitas, serta kepatuhan terhadap regulasi.

Baca Juga:  ChatGPT Terancam Diblokir Komdigi, Apa yang Terjadi dengan Kemajuan Teknologi Indonesia?

Jendela Konteks yang Sangat Besar

Salah satu peningkatan paling menonjol dari Gemini 3 Pro adalah jendela konteks mencapai satu juta token. Batas ini memungkinkan model membaca dan menganalisis dokumen besar, skrip kode panjang, bahkan rangkaian gambar dan video dalam satu sesi tanpa kehilangan konteks.

Model card terbaru menunjukkan bahwa Gemini 3 Pro dapat menghasilkan hingga 64.000 token dalam satu keluaran, dengan knowledge cutoff Januari 2025. Google mengakui model masih bisa mengalami halusinasi dan timeout dalam kondisi tertentu, tetapi peningkatannya jauh dibanding seri sebelumnya.

Hasil Benchmark yang Menonjol

Gemini 3 Pro menunjukkan performa kuat pada sejumlah benchmark reasoning dan multimodal, bahkan mengungguli banyak model frontier lain. Di antaranya mencatat skor tinggi pada Humanity’s Last Exam, ARC-AGI, MMMU-Pro, Video-MMMU, dan SimpleQA Verified. Performa ini menjadi dasar klaim Google bahwa Gemini 3 Pro kini berada di posisi terdepan untuk pengujian reasoning dan pemahaman multimodal.

Mode Deep Think yang juga diperkenalkan dalam seri ini memperlihatkan peningkatan lebih jauh. Mode tersebut dirancang untuk kasus analisis mendalam atau persoalan yang memerlukan penalaran berlapis. Pada uji GPQA Diamond dan ARC-AGI dengan tool, mode ini telah mencapai rekor baru.

Kemampuan Coding dan Agentic AI

Google memberi perhatian besar pada kemampuan Gemini 3 Pro dalam coding. Hasil pengujian dari berbagai arena menunjukkan model ini berada di puncak peringkat AI coding. Gemini 3 Pro dapat merencanakan struktur aplikasi, menulis kode, melakukan debugging, dan melakukan deployment langsung.

Selain itu, Google memperkenalkan platform Antigravity, sebuah IDE agentic yang memungkinkan model bekerja sebagai agen mandiri. Melalui Antigravity, Gemini mampu merancang solusi end-to-end, menjalankan perintah di terminal, serta memvalidasi hasil tanpa instruksi manual di setiap langkah.

Baca Juga:  QRIS Tap Hadir di Samsung Galaxy, Bayar Jadi Sekali Sentuh

Kreativitas, Pembelajaran, dan Pemrosesan Multimodal

Dengan kemampuan multimodal bawaan, Gemini 3 Pro dapat mengolah berbagai format input dan mengubahnya menjadi output yang memenuhi kebutuhan pengguna. Model ini dapat mengonversi catatan tulisan tangan menjadi dokumen digital, merangkum makalah ilmiah panjang menjadi poin-poin belajar, serta menganalisis video untuk membuat rencana latihan atau strategi permainan.

Dalam integrasi dengan Google Search, mode AI baru juga dirancang untuk menghasilkan rangkuman visual dan simulasi interaktif yang menyesuaikan kebutuhan pencarian pengguna. Ke depan, Google memperkirakan kemampuan agentic AI akan menjadi bagian penting dalam meningkatkan produktivitas digital pengguna sehari-hari.

Ketersediaan dan Akses Pengguna

Gemini 3 tersedia di berbagai platform, mulai dari Google AI Studio hingga Gemini API dan Vertex AI. Pengguna juga bisa mencobanya melalui layanan pihak ketiga seperti Cursor, JetBrains, Replit, dan GitHub. Model tidak langsung tersedia untuk seluruh pengguna aplikasi Gemini pada hari peluncuran, tetapi Google memberikan opsi untuk mencoba versi preview di sejumlah platform.

Dalam hal keamanan, Google menyatakan bahwa Gemini 3 merupakan model dengan perlindungan paling lengkap yang pernah mereka rilis. Model telah diuji melalui kerangka Frontier Safety Framework dan dievaluasi pihak ketiga untuk memastikan ketahanannya terhadap serangan, penipuan prompt, dan penyalahgunaan.

Meski membawa banyak peningkatan teknis, tantangan terbesar Google berada pada sisi adopsi pengguna. Pasar saat ini didominasi layanan seperti ChatGPT, yang memiliki jumlah pengguna mingguan sangat besar. Dengan hadirnya Gemini 3, Google berharap dapat memperkuat posisi mereka dan meningkatkan jumlah pengguna aktif aplikasi Gemini.

Keunggulan performa harus diterjemahkan menjadi pengalaman nyata yang mudah diakses dan bermanfaat bagi pengguna umum. Jika Google dapat menghadirkan kualitas dan kecepatan ini di seluruh produknya, Gemini 3 berpotensi menjadi salah satu model AI dengan dampak terbesar dalam beberapa tahun ke depan.

[addtoany]

Related Post