Selular.ID – Dirilis seminggu yang lalu, model sumber terbuka HunYuan Image 3.0 yang dikembangkan oleh raksasa internet Tencent yang berbasis di Shenzhen telah menduduki puncak peringkat teks-ke-gambar dalam daftar ternama yang mengevaluasi model-model besar global, yang mencerminkan kemampuan canggih produk-produk China dalam ekosistem multimoda.
Menurut peringkat terbaru LMArena yang diperbarui pada Minggu (5/10), model tersebut melonjak ke posisi pertama di antara 26 model besar global di sektor teks-ke-gambar, mengalahkan sistem proprietary yang dikembangkan oleh raksasa AI Google dan OpenAI seperti Gemini 2.5 Flash Image Preview, yang dijuluki “Nano Banana”.
LMArena adalah platform evaluasi model AI inovatif yang diluncurkan oleh UC Berkeley.
Peringkatnya dihasilkan melalui mekanisme “pemungutan suara buta”, yang mengundang pengguna manusia untuk memilih secara anonim guna mengukur kinerja model.
HunYuan Image 3.0 adalah model grafik multimoda asli Tencent yang dirilis dan bersumber terbuka pada 28 September lalu.
Model ini telah menduduki posisi teratas selama seminggu terakhir dalam daftar terpopuler Hugging Face — komunitas sumber terbuka terbesar di dunia.
Menurut Tencent, HunYuan Image 3.0 memiliki akal sehat dan dapat bernalar menggunakan pengetahuan. Model ini juga mencapai akurasi tinggi dalam pemahaman semantik dan memberikan kualitas estetika yang luar biasa, menghasilkan gambar yang realistis dan berkualitas tinggi.
Selain itu, HunYuan Image 3.0 mendukung pembuatan teks dalam bahasa Mandarin dan Inggris, termasuk rendering teks berformat panjang.
Baca Juga: Tencent Rilis Hunyuan 3D 3.0, Generasi AI untuk Model 3D Realistis
Model ini akan memperkenalkan lebih banyak fitur seperti pembuatan gambar-ke-gambar, penyuntingan gambar, dan interaksi multi-putaran, dalam pembaruan mendatang.
Pada Kamis lalu (2/10), model pembuatan video Kling 2.5 Turbo, yang dikembangkan oleh platform video pendek China Kuaishou, juga mendominasi peringkat gambar-ke-video dan teks-ke-video dalam pemeringkatan organisasi pembanding AI Artificial Analysis, mengungguli model-model seperti Veo 3, Ray3, dan PixVerse V5.
Peter, seorang penggemar teknologi yang mengikuti tren AI dengan saksama, mengatakan Hunyuan Image 3.0 telah mencapai tingkat pemahaman baru dalam hal bahasa dan elemen budaya China.
HunYuan Image 3.0 tidak lagi bergantung pada penggabungan elemen yang kaku, tetapi benar-benar memahami esensi artistik dan konotasi budaya dari input. Baik kemampuan pemahamannya maupun kualitas presentasinya cukup mengesankan, katanya.
Liu Cong, seorang influencer media sosial yang telah menulis dua buku tentang model AI skala besar, mengatakanTencent telah aktif membuka sumber modelnya belakangan ini. Meskipun iterasinya semakin cepat, kualitas model HunYuan Image tetap stabil.
Selain itu, dengan ekosistem Tencent yang tangguh, serangkaian model HunYuan terintegrasi ke dalam berbagai produk perusahaan.
Ia mencatat bahwa strategi jangka panjang raksasa teknologi tersebut di sektor AI adalah membangun keunggulan teknologi menggunakan pendekatan sumber terbuka dan memvalidasi skenario aplikasi dengan ekosistemnya.
Meskipun HunYuan telah mencapai tingkat teratas dalam pembuatan gambar dan 3D, Liu mengatakan ia yakin masih ada ruang untuk peningkatan dalam pemahaman teks dan multimoda.
Ia menambahkan bahwa kinerja HunYuan dan Kling baru-baru ini merupakan langkah awal dalam babak baru perusahaan-perusahaan China dalam persaingan melawan raksasa AI asing, dan ia menantikan kemajuan berkelanjutan dari model-model skala besar domestik.
Baca Juga: Tencent Catat Kenaikan Pendapatan 15% di Kuartal II 2025 Berkat Game dan AI