Rabu, 13 Agustus 2025
Selular.ID -

GPT-5 Ungguli Gemini 2.5 Pro dalam Tes Benchmark Terbaru

BACA JUGA

Selular.id – OpenAI resmi merilis GPT-5 pada 7 Agustus 2025, dan model terbaru ini langsung menempati posisi teratas di dua benchmark penting, LMArena dan WebDev Arena.

Kehadiran GPT-5 menggeser dominasi Gemini 2.5 Pro milik Google yang sebelumnya memimpin dalam tes kecerdasan buatan (AI).

GPT-5 bukan sekadar pembaruan kecil dari pendahulunya. Model ini menggabungkan beberapa sub-model yang dapat secara otomatis memilih versi terbaik berdasarkan permintaan pengguna. Fitur bernama real-time routing ini memungkinkan ChatGPT menggunakan model ringan untuk pertanyaan sederhana atau mengaktifkan GPT-5 Thinking untuk analisis kompleks tanpa intervensi manual.

Menurut OpenAI, GPT-5 mengurangi kesalahan fakta hingga 45% dibanding GPT-4o ketika pencarian web diaktifkan. Kemampuannya dalam menulis, pemrograman, dan tugas berbasis kesehatan juga lebih unggul berdasarkan pengujian independen. Namun, Gemini 2.5 Pro masih lebih baik dalam generasi gambar dan video, seperti yang terlihat dalam benchmark teks-ke-gambar dan teks-ke-video LMArena.

Gemini 2.5 Pro graphics and benchmark results.

Dalam uji coba langsung, Gemini menghasilkan gambar lebih cepat dan akurat dibanding ChatGPT. Misalnya, ketika diminta membuat gambar “Johnny Thunderbird memegang piala Big East Tournament di Madison Square Garden”, Gemini mengenali konteks tim basket dan detail lokasi, sementara ChatGPT menghasilkan gambar dengan latar yang kurang spesifik.

Meski unggul di beberapa aspek, OpenAI menghadapi tantangan unik: banyak pengguna yang meminta kembalinya GPT-4o. Model sebelumnya ini dipertahankan setelah protes dari komunitas yang sudah terbiasa menggunakannya. Fenomena ini menunjukkan betapa kuatnya loyalitas pengguna terhadap model AI tertentu.

Persaingan antara OpenAI dan Google dalam pengembangan AI masih berlanjut. Sementara GPT-5 memimpin di bidang pemrosesan teks dan kode, Gemini 2.5 Pro tetap menjadi pilihan terbaik untuk tugas kreatif visual. Sebelumnya, bocoran fitur GPT-5 sempat menjadi sorotan, dan kini performanya terbukti sesuai ekspektasi.

- Advertisement 1-

BERITA TERKAIT

BERITA PILIHAN

BERITA TERBARU