Kamis, 31 Juli 2025
Selular.ID -

Mencoba Fitur Gemini 2.0 Flash Image Generation, Kadang Tak Sesuai Harapan

BACA JUGA

SELULAR.ID – Google belum lama ini merilis fitur edit gambar secara langsung bernama Gemini 2.0 Flash Image Generation, di dalam AI Studio Google. Fitur ini gratis bagi pengembang melalui Google AI Studio dan Gemini API, yang digunakan untuk bereksperimental mengedit foto atau gambar.

Fitur eksperimental Gemini 2.0 Flash Image Generation tersebut menjadi yang pertama bagi Google, dalam menggabungkan kemampuan pembuatan teks dan gambar dalam satu model AI. Gemini 2.0 Flash menggabungkan input multimodal, pemrosesan bahasa alami, dan kemampuan penalaran tingkat lanjut untuk menghasilkan gambar yang selaras dengan teks.

Berbeda dengan model AI gambar tradisional yang menggunakan model difusi terpisah yang terhubung ke model bahasa besar (LLM), Gemini 2.0 Flash Image Generational dapat langsung menghasilkan gambar dalam model yang sama yang memproses perintah teks.

Pendekatan ini diharapkan meningkatkan akurasi, konsistensi, dan kreativitas secara keseluruhan. Meskipun, beberapa eksperimen yang dicoba kadang tak sesuai harapan.

Baca juga: SoftBank Group Akuisisi Ampere Computing Senilai $6,5 Miliar

Versi eksperimental yang kini tersedia menawarkan berbagai fitur menarik bagi pengembang, di antaranya:

Pembuatan Ilustrasi dan Cerita

Pengguna bisa membuat cerita bergambar dengan karakter dan latar yang konsisten. Model ini juga dapat menyesuaikan ilustrasi sesuai dengan umpan balik pengguna.

Penyuntingan Gambar Secara Interaktif

Dengan fitur pengeditan berbasis percakapan, pengguna bisa menyempurnakan gambar hanya dengan memberikan instruksi dalam bentuk teks. Misalnya, mengubah warna baju atau menyesuaikan gaya ilustrasi tanpa perlu alat pengeditan rumit.

Pembuatan Gambar Berbasis Pengetahuan Dunia Nyata

Model ini dapat menghasilkan gambar yang sesuai dengan informasi nyata. Misalnya, saat diminta membuat ilustrasi resep, gambar yang dihasilkan akan mencerminkan bahan dan metode memasak yang sebenarnya.

Peningkatan Kualitas Teks dalam Gambar

Berbeda dengan model AI lainnya, Gemini 2.0 Flash mampu menampilkan teks dalam gambar dengan lebih jelas dan akurat. Hal ini membuatnya sangat berguna untuk iklan, unggahan media sosial, atau undangan digital.

Hasil Eksperimental

Dalam unggahan di platform X, seorang pengguna dengan akun @HalimAlrasihi mengaku terkesima, saat ia mengedit foto seorang model, untuk mengenakan pakaian bermerek hanya bermodal dua foto. Foto model berbaju lain, dan foto jaket retail yang ingin dikenakan model tersebut.

Baca juga: THR Cair, Rekomendasi Hp Gaming Dengan Fitur GenAI

Hasilnya, model orang dalam gambar menggunakan produk pakaian sesuai yang diinginkan, dengan latar seolah sang model sedang berjalan di atas papan peraga atau catwalk.

Namun, eksperimen lain yang dilakukan tidak menghasilkan gambar sesuai yang diinginkan. Saat penulis mencobanya untuk mengubah buku asli di tangan seorang model, menjadi buku lain, AI tidak dapat menjalankannya.

AI pada Google Flash 2.0 Image Generation hanya bisa mengarang sampul buku sesuai dengan imajinasinya, meski sudah diberikan contoh cover buku asli. Perintah yang kurang jelas akan memunculkan dialog ‘respon model diblokir, harap bersihkan obrolan Anda atau mulai permintaan baru untuk melanjutkan’.

Jika Anda juga ingin mencobanya, klik tautan berikut ( https://t.co/Ql8aHNG3la atau https://ai.google.dev/aistudio?hl=id ). Pada ‘run setting’ di sisi sebelah kanan, pilih model AI ‘Gemini 2.0 Flash Image Generation’ untuk kemudahan mengedit foto dengan unggahan gambar.

Ikuti informasi menarik lainnya dari Selular.id di Google News

- Advertisement 1-

BERITA TERKAIT

BERITA PILIHAN

BERITA TERBARU