DeepMind’in Çığır Açan Modeli Genie 3: Yapay Zeka ile İnteraktif 3D Dünyalar Yaratıyor

Google’ın yapay zeka laboratuvarı DeepMind, sanal dünya üretiminde devrim yaratacak yeni bir model olan Genie 3‘ü tanıttı. Henüz araştırma aşamasında olan ve halka açık erişime kapalı bu teknoloji, önceki sürümlerinin yeteneklerini birleştirerek interaktif 3D ortamlar oluşturma kapasitesini ileri bir seviyeye taşıyor.

Teknik Kapasitede Büyük Sıçrama

Genie 3, önceki versiyonu Genie 2 ve video üretim modeli Veo 3’ün en iyi özelliklerini bir araya getiriyor. Bu yeni model, 720p çözünürlükte ve saniyede 24 kare (fps) hızında, dakikalarca süren etkileşimli 3D ortamlar yaratabiliyor. Bu, Genie 2’nin üretebildiği 10-20 saniyelik kısa sahnelere kıyasla olağanüstü bir gelişme olarak öne çıkıyor.

Öğrenme ve Tutarlılık Yeteneği

Modelin en etkileyici özelliklerinden biri, daha önce oluşturduğu görüntüleri hafızasında tutarak olayların gelişimine mantıksal bir tutarlılıkla karar verebilmesidir. DeepMind, bu tutarlılığın yapay olarak kodlanmadığını, modelin tamamen kendi kendine öğrendiğini belirtiyor.

DeepMind araştırmacılarından Shlomi Fruchter, “Bu modeli gerçek dünyayı taklit edecek, fizik kurallarına uygun biçimde kararlar alacak şekilde eğitmedik. O, bu tutarlılığı kendi öğrendi,” diyerek modelin otonom öğrenme kapasitesini vurguluyor.

Kullanıcı Komutlarıyla Etkileşim

Genie 3, kullanıcıdan aldığı metin tabanlı komutlarla sahneleri dinamik olarak değiştirebiliyor. Örneğin, bir depoda bulunan bir yapay zeka karakterine “yeşil çöp presine doğru yaklaş” veya “kırmızı forklifte doğru yürü” gibi komutlar verildiğinde, Genie 3 sadece ortamı yaratmakla kalmıyor, aynı zamanda karakterin bu dünyada eyleme geçmesini de sağlıyor. DeepMind tarafından yapılan testler, bu tür görevlerin başarıyla yerine getirildiğini gösteriyor.

Mevcut Sınırlar ve Zorluklar

Her devrimsel teknolojide olduğu gibi Genie 3’ün de bazı sınırları bulunuyor. Yapılan testlerde karşılaşılan bazı zorluklar şunlardır:

  • Bir kayakçının yokuş aşağı kaydığı sahnede, karın fiziksel olarak gerçekçi tepkiler vermemesi.
  • Modelin, birden fazla bağımsız karakterin karmaşık etkileşimlerini simüle etmede henüz yetersiz kalması.
  • Simülasyonların birkaç dakika ile sınırlı olması, saatler sürebilecek uzun eğitim senaryoları için yetersiz kalması.

Yapay Zekanın Geleceği İçin Bir Adım

Bu sınırlamalara rağmen uzmanlar, Genie 3’ün yapay zekanın insan davranışlarını taklit etme yolunda önemli bir adım olduğunu düşünüyor. Teknoloji, yapay zekanın plan yapma, çevresini keşfetme, belirsiz durumlarla başa çıkma ve deneyim yoluyla kendini geliştirme gibi yeteneklerini bir üst seviyeye taşıma potansiyeli taşıyor.