Selamlar,
Google’ın Veo 3.1 modeliyle üretilen videolarda maksimum tutarlılığı nasıl sağlayabilirim?
Viral araba edit videolarında kullanılan speedramp teknikleri üzerine çalışıyorum ve bunun için sinematik, kontrollü kamera hareketlerine sahip footage’lara ihtiyacım var. Bu footage’ları Flow üzerinden Veo 3.1 modelini kullanarak üretmek istiyorum.
Örneğin, referans olarak yüklediğim bir araba görseli üzerinden şu sahneyi oluşturmak istiyorum: Kamera arabanın önünden başlasın ve sabit bir hızla aracın etrafında 180 derece dönsün. Ancak bunu istediğim şekilde yapmıyor. Kamera dönerken araba da kendi etrafında dönmeye başlıyor.
Prompt’ta özellikle arabayı sabit bir nesne olarak tanımlamama rağmen bu sorunu yaşıyorum. Buna benzer pek çok tutarsızlıkla karşılaşıyorum. Bu tarz sahnelerde maksimum tutarlılığı sağlamak için nasıl bir prompt yapısı önerirsiniz?
Hocam video kısmında şu an en iyisi veo değil diye biliyorum. http://civitai.com/ da rehberler vardı onlara bakabilirsiniz.
Aivideo subredditinde olan rehberlere bakabilirsiniz.
https://www.reddit.com/r/aivideo/comments/1r7fo9f/zombit_80s_zombie_flick_with_a_twist/
Bu içerikte hazırlayan kişi hangi araçları kullandığını yazmış.
Teşekkür ederim inceleyeceğim.
claude veya iyi bir LLM kullanarak promptunu detaylandirabildigin kadar detaylandir, sorun çıktıkça sorunu paylaş llm ile düzeltsin; en son güzel bir duruma getirdikten sonra ileride direkt promptlarımı geliştirmen ve detaylandırman için bana detaylı bir system promptu üret de. bundan sonra onu kullan bir prompt yazacağında; fayda edebilir. ama aynen @hybrid'in dediği gibi veo'ya tırt diyorlar endüstridekiler bile, lakin açık kaynaklar da öyle kolay değil.
Detaylandırma işlemi için Chatgpt ile Gemini'ı denedim. İkisinden de tam verim alamadım. İşin garip tarafı aynı prompt'u yazıp çıktı sayısını arttırdığımda tutarlılık bir nebze daha artıyor fakat hâlâ tatmin edici seviyede değil. Açık kaynak olarak localde ücretsiz çalışan en iyi model Wan 2.6 diye biliyorum. Fakat o da 24GB VRAM, 64GB RAM istiyor. 3060 ile bunun üstesinden gelebileceğimi sanmıyorum. O yüzden Google üyeliği bitmeden Veo'yu adam etmem lazım 🙂
@muazed wan açık değil; o da paralı. en son açık wan 2.2, ya ltx 2 var yeni çıkan onlara bakın vazgeçersiniz zaten hemen
muhtemelen veo'da da vardır, sabitlik için first frame last frame özelliğini kullanıyorlar genelde, yani iki foto üretiyorsunuz referans için, başlangıcı ve sonunu yapay zekaya verdiğinizde daha tutarlı oluyor tüm klip.
iki foto üretmek için de görsel üretme/düzenleme modellerine girmeniz gerekiyor...
@muazed ben 2 senedir yapay zekaya iş veriyorum 😀 prompt doldurma olayını çok iyi biliyorum; başını bayağı detaylıca ve güzel yapıp sonrasını az alakasız eften bilgilerle doldursanız bile daha iyi verim veriyor gibi hisettiriyor bana bazen yapay zeka.
@cestlavie evet onu da denedim. bahsettiğim biraz tutarlılık onlarda oldu. Ama yine istediğim sonucu alamıyorum. Arabanın arka görseliyle yan görselini koyuyorum. Kamera hareketi için pormoptu da giriyorum. Sonuç: arabanın arkasını gösterirken fade out yapıp yan görseline geçiyor 😀😀 Bence model o kadar kötü değil, potansiyeli var. Mesela bir kişinin fotoğrafını verip onu konuşturup aynı zamanda dudak senkronunu çok iyi yapıyor. Konuştururken cümlenin yapısına göre duygu bile veriyor fakat benim istediğim tarzda sinematik çekimlerde promptları anlamadığını düşünüyorum.