Mencoba Fitur Gemini 2.0 Flash Image Generation, Kadang Tak Sesuai Harapan

SELULAR.ID – Google belum lama ini merilis fitur edit gambar secara langsung bernama Gemini 2.0 Flash Image Generation, di dalam AI Studio Google. Fitur ini gratis bagi pengembang melalui Google AI Studio dan Gemini API, yang digunakan untuk bereksperimental mengedit foto atau gambar.

Fitur eksperimental Gemini 2.0 Flash Image Generation tersebut menjadi yang pertama bagi Google, dalam menggabungkan kemampuan pembuatan teks dan gambar dalam satu model AI. Gemini 2.0 Flash menggabungkan input multimodal, pemrosesan bahasa alami, dan kemampuan penalaran tingkat lanjut untuk menghasilkan gambar yang selaras dengan teks.

Berbeda dengan model AI gambar tradisional yang menggunakan model difusi terpisah yang terhubung ke model bahasa besar (LLM), Gemini 2.0 Flash Image Generational dapat langsung menghasilkan gambar dalam model yang sama yang memproses perintah teks.

Pendekatan ini diharapkan meningkatkan akurasi, konsistensi, dan kreativitas secara keseluruhan. Meskipun, beberapa eksperimen yang dicoba kadang tak sesuai harapan.

Versi eksperimental yang kini tersedia menawarkan berbagai fitur menarik bagi pengembang, di antaranya:

Pembuatan Ilustrasi dan Cerita

Pengguna bisa membuat cerita bergambar dengan karakter dan latar yang konsisten. Model ini juga dapat menyesuaikan ilustrasi sesuai dengan umpan balik pengguna.

Penyuntingan Gambar Secara Interaktif

Dengan fitur pengeditan berbasis percakapan, pengguna bisa menyempurnakan gambar hanya dengan memberikan instruksi dalam bentuk teks. Misalnya, mengubah warna baju atau menyesuaikan gaya ilustrasi tanpa perlu alat pengeditan rumit.

Pembuatan Gambar Berbasis Pengetahuan Dunia Nyata

Model ini dapat menghasilkan gambar yang sesuai dengan informasi nyata. Misalnya, saat diminta membuat ilustrasi resep, gambar yang dihasilkan akan mencerminkan bahan dan metode memasak yang sebenarnya.

Peningkatan Kualitas Teks dalam Gambar

Berbeda dengan model AI lainnya, Gemini 2.0 Flash mampu menampilkan teks dalam gambar dengan lebih jelas dan akurat. Hal ini membuatnya sangat berguna untuk iklan, unggahan media sosial, atau undangan digital.

Hasil Eksperimental

Dalam unggahan di platform X, seorang pengguna dengan akun @HalimAlrasihi mengaku terkesima, saat ia mengedit foto seorang model, untuk mengenakan pakaian bermerek hanya bermodal dua foto. Foto model berbaju lain, dan foto jaket retail yang ingin dikenakan model tersebut.

Hasilnya, model orang dalam gambar menggunakan produk pakaian sesuai yang diinginkan, dengan latar seolah sang model sedang berjalan di atas papan peraga atau catwalk.

Namun, eksperimen lain yang dilakukan tidak menghasilkan gambar sesuai yang diinginkan. Saat penulis mencobanya untuk mengubah buku asli di tangan seorang model, menjadi buku lain, AI tidak dapat menjalankannya.

AI pada Google Flash 2.0 Image Generation hanya bisa mengarang sampul buku sesuai dengan imajinasinya, meski sudah diberikan contoh cover buku asli. Perintah yang kurang jelas akan memunculkan dialog ‘respon model diblokir, harap bersihkan obrolan Anda atau mulai permintaan baru untuk melanjutkan’.

Jika Anda juga ingin mencobanya, klik tautan berikut ( https://t.co/Ql8aHNG3la atau https://ai.google.dev/aistudio?hl=id ). Pada ‘run setting’ di sisi sebelah kanan, pilih model AI ‘Gemini 2.0 Flash Image Generation’ untuk kemudahan mengedit foto dengan unggahan gambar.

Ikuti informasi menarik lainnya dari Selular.id di Google News

Mencoba Fitur Gemini 2.0 Flash Image Generation, Kadang Tak Sesuai Harapan

BACA JUGA

Apple Serius Saingi Gmail, Gratiskan Email Untuk Usaha Kecil Menengah

Aplikasi Layanan Streaming Anime Crunchyroll Dibobol, Data Pelanggan Bocor

Render Bocor Motorola Razr Ultra 2026 Ungkap Desain Tak Biasa

Shahed 136 Vs MQ-9 Reaper: Membandingkan Drone Murah Iran dan Drone Mahal AS Di Tengah Eskalasi Konflik

Perang Iran – AS Untungkan Produsen Mobil Listrik China, Jepang Semakin Tertinggal

Hacker Bobol Perusahaan Telekomunikasi, Lebih dari 6 Juta Data Pelanggan Dijual

Pembuatan Gambar Berbasis Pengetahuan Dunia Nyata

BERITA TERKAIT

15 Besar Situs Paling Populer di Dunia, Nomor Satu Bukan ChatGPT

Google Perluas Pencarian AI Real-Time ke Lebih Banyak Bahasa

Google Rilis Android Automotive OS Open Source Baru

Apple Serius Saingi Gmail, Gratiskan Email Untuk Usaha Kecil Menengah

ASEAN Foundation Gelar Workshop AI Ready, Ratusan Pelajar Belajar Konsep Dasar AI

TWS AI yang Bisa Terjemahkan Ratusan Bahasa Laris Manis

BERITA PILIHAN

DJI Avata 360 Hadirkan Drone FPV 8K 360° di Indonesia Seharga 10 Jutaan

Rekomendasi HP Baterai Besar Harga Rp4 Jutaan

Xiaomi 17 dan 17 Ultra Dibandingkan, Fokus Kamera Berbeda

BBM Mahal, Perusahaan Taksi Online Ini Bakal Naikkan Tarif

Render Bocor Motorola Razr Ultra 2026 Ungkap Desain Tak Biasa

Harga Hp Sharp Dipastikan Naik

Apple Siapkan Iklan di Apple Maps untuk Monetisasi Layanan

Poco X Series Perkuat Posisi di Segmen Gaming Mobile

BERITA TERBARU

Lava Bold N2 4G Resmi, Ini Spesifikasinya

Rekomendasi Hp Poco NFC Terbaru Harga Rp1 hingga Rp2 jutaan, Sudah 5G

Penyebab Iklan di Hp Realme, dan Cara Menghapusnya

PP Tunas Berlaku, Operator Seluler Ungkapkan Hal Ini

Respon Platform Media Sosial Saat PP Tunas Berlaku

15 Besar Situs Paling Populer di Dunia, Nomor Satu Bukan ChatGPT