Cara Membuat Image dan Video AI dengan Google Gemini VEO 2 dan Sora By OpenAI

by

FYI

June 12, 2025

Cara Membuat Image dan Video AI dengan Google Gemini VEO 2 dan Sora By OpenAI

Jujur aja, selama ini saya lebih sering manfaatin AI untuk urusan produktivitas dan kerjaan. Cuma, keseringan buka social media “threads” dan ngikutin obrolan tentang AI Threads disana ternyata justru bikin saya ikut kecanduan sama trend generate image dan video by AI haha. So, ya mari kita bahas bareng.

Saya pribadi sih nggak gitu fokus sama 1 tools tertentu sebetulnya, tergantung kebutuhan. Jadi disinipun, saya nggak akan mendewa-dewakan tools yang satu lebih daripada yang lain. Cuma, karena dari hasil pengamatan saya 2 tools yang paling sering dipakai untuk generate image dan video adalah ChatGPT & Gemini. So, dipostingan ini saya hanya akan ngebuat perbandingan diantara keduanya. Dan mari kita kesampingkan dulu tools lain kaya Midjourney atau Leonardo AI.

Kita samain persepsi dulu ya, jadi disini goal atau tujuan saya menggunakan keduanya adalah untuk membuat gambar yang memperlihatkan “seorang wanita indonesia sedang duduk di coffee shop sambil mencium aroma dari kopi yang dipesannyaThat’s it!

Kita mulai dari Gemini,

Pertama, saya akan menggunakan prompt berikut:

Create realistic editorial image indonesian girl [brunette, white skin, thin pink lips] with croptop and jeans smile when smells the coffee on the coffee shop at night. 4K FHD Image.

Dan ini hasilnya:

Hasil Generate Image AI By Google Gemini

Nah, dibawahnya saya coba memberikan prompt tambahan,

From that image create video with VEO

Sayangnya, Gemini ternyata belum bisa mengeksekusi perintah ini secara langsung. Seperti yang bisa kalian lihat pada screenshoot berikut.

So, gimana caranya supaya image tersebut bisa kita jadikan video tanpa mengubah suasana dan karakter yang sudah kita buat tadi?

Pertama, minta Gemini mendeskripsikan video berdasarkan gambar tersebut, contohnya dari gambar diatas Gemini memberikan deskripsi berikut agar saya bisa membuat video yang identik:

The video would open with a close-up shot of a young Indonesian woman with long, dark brunette hair and what appears to be fair skin. She would have thin, pink lips and be wearing a striped crop top and jeans. She is sitting at a wooden table in what looks like a coffee shop at night. Soft, warm lighting and bokeh effects from out-of-focus lights in the background would create a cozy atmosphere. The woman is holding a dark-colored mug with both hands, bringing it closer to her face. As she inhales, a subtle smile would appear on her lips, indicating her enjoyment of the coffee’s aroma. The camera might slightly pan or focus to emphasize her expression and the steam rising from the mug. The overall mood would be relaxed and pleasant.

Sekarang, buka https://aistudio.google.com/prompts/new_chat

Pilih generate media, lalu pilih VEO.

Disini, kita akan pakai model VEO 2. Karena by default, VEO 3 memang belum tersedia di Indonesia. Khususnya via Google AI studio. Untuk Gemini, bisa kalian akalin menggunakan VPN USA kalau ingin menggunakan model VEO 3. Cuma karena kebutuhan saya disini adalah membuat video berdasarkan gambar yang sudah ada, bukan ngeprompt ulang untuk menciptakan karakter konsisten yang ingin saya tampilkan dalam format video, jadi yang saya butuhkan adalah fitur add an image to the prompt yang dimiliki oleh Google AI Studio.

Pertama, saya akan add terlebih dahulu gambar yang sudah kita buat tadi.

Lau saya tambahkan prompt berupa deskripsi video yang saya minta tadi. Dan ini hasilnya

Identik ya hehe

Nah, sekarang mari kita beralih ke OpenAI.

Login ke akun ChatGPT kalian masing-masing, lalu buka https://sora.chatgpt.com/explore

Yap, kita nggak akan langsung ngeprompt di ChatGPT tapi di Sora. Goal-nya masih sama, yakni membuat gambar yang memperlihatkan “seorang wanita indonesia sedang duduk di coffee shop sambil mencium aroma dari kopi yang dipesannya“. Tapi, supaya hasilnya lebih identik dengan gambar yang sudah kita buat di Gemini, Maka prompt basic-nya akan saya mix dengan deskripsi yang saya berikan untuk membuat video tadi. So, promptnya jadi seperti ini:

Create realistic editorial image Indonesian woman with long, dark brunette hair and what appears to be fair skin. She would have thin, pink lips and be wearing a striped crop top and jeans. She is sitting at a wooden table in what looks like a coffee shop at night. Soft, warm lighting and bokeh effects from out-of-focus lights in the background would create a cozy atmosphere. The woman is holding a dark-colored mug with both hands, bringing it closer to her face. As she inhales, a subtle smile would appear on her lips, indicating her enjoyment of the coffee’s aroma. The camera might slightly pan or focus to emphasize her expression and the steam rising from the mug. The overall mood would be relaxed and pleasant.

Dan ini hasilnya:

Hasil Generate Image AI By Sora

Not bad, detailnya hampir-hampir mirip. Nah, sekarang mari kita bikin videonya. Asiknya Sora adalah, untuk membuat video dari image yang kita generate kita cuma perlu klik klik doang.

Yap, cukup pilih Create video yang ada persis dibawah gambar tersebut. Dan tunggu sampai proses generatenya selesai.

Dan taaraa… ini hasilnya

Sengaja saya generate 2 video karena berbeda dengan gemini yang bisa generate sampai 8 detik, di Sora akun saya cuma bisa generate max 5 detik hehe.

Kesimpulannya, baik Gemini maupun OpenAI sama-sama bagus sih ya kalau buat saya haha

Dan keduanya bisa kalian subscribe dengan sangat murah atau bahkan gratis, nanti saya bahas di postingan lain deh ya kalau sempat hehe

See ya..