DeepMind'ın Yeni Dünya Modeli Genie 3: Yapay Genel Zekaya Giden Yolda Bir Kilometre Taşı

Haber Merkezi

05 August 2025, 20:12 tarihinde yayınlandı

DeepMind'dan AGI Hamlesi: Genie 3 İle Yapay Zeka Kendi Dünyasını Yaratıyor

Google'ın yapay zeka laboratuvarı DeepMind, teknoloji dünyasında heyecan yaratan yeni bir temel dünya modeli olan Genie 3'ü tanıttı. Bu çığır açan teknoloji, basit metin komutlarını kullanarak saniyeler içinde tamamen etkileşimli, üç boyutlu ve fiziksel olarak tutarlı sanal dünyalar yaratabiliyor. DeepMind, Genie 3'ü, insan benzeri zekaya sahip "Yapay Genel Zeka" (AGI) hedefine giden yolda atılmış en önemli adımlardan biri olarak konumlandırıyor.

Sıradan Bir Video Üretecinden Çok Daha Fazlası

DeepMind Araştırma Direktörü Shlomi Fruchter, Genie 3'ü "ilk gerçek zamanlı, etkileşimli ve genel amaçlı dünya modeli" olarak tanımlıyor. Önceki modellerin aksine, Genie 3 belirli bir ortamla sınırlı değil. Fotogerçekçi dünyalardan tamamen hayal ürünü fantastik evrenlere kadar geniş bir yelpazede üretim yapabiliyor.

Modelin yetenekleri oldukça etkileyici. Önceki versiyonu olan Genie 2, yalnızca birkaç saniyelik ortamlar oluşturabilirken, Genie 3, 720p çözünürlükte ve saniyede 24 kare (24 fps) hızında dakikalarca süren etkileşimli ortamlar üretebiliyor. Ayrıca, "komutla yönlendirilebilir dünya olayları" özelliği sayesinde, kullanıcılar yeni bir komutla oluşturulan dünyayı anında değiştirebiliyor.

"Dünya modellerinin, özellikle gerçek dünya senaryolarını simüle etmenin zor olduğu fiziksel ajanlar için, AGI'ye giden yolda anahtar olduğunu düşünüyoruz."

— Jack Parker-Holder, DeepMind Araştırma Bilimcisi

Fizik Kurallarını Kendi Kendine Öğrenen Model

Genie 3'ün belki de en devrimci özelliği, fizik kurallarını kendi kendine öğrenme yeteneği. Model, önceden programlanmış bir fizik motoruna dayanmıyor. Bunun yerine, ürettiği her kareyi hatırlayarak ve bu bilgiler üzerinden mantık yürüterek nesnelerin nasıl hareket ettiğini, düştüğünü ve etkileşime girdiğini öğreniyor. Bu "otoregresif" yapı, yani her yeni kareyi bir öncekinin üzerine inşa etme mantığı, simülasyonların zaman içinde tutarlı kalmasını sağlıyor.

Bu yetenek, tıpkı insanların bir masanın kenarındaki bardağın düşmek üzere olduğunu anlaması gibi, modelin de bir tür sezgisel fizik anlayışı geliştirmesine olanak tanıyor. Bu durum, özellikle yapay zeka ajanlarının eğitimi için hayati önem taşıyor.

Sınırlar ve Gelecek Vizyonu: Yeni Bir "Move 37" Anı mı?

Elbette Genie 3'ün de mevcut sınırlılıkları var. Örneğin, modelin fizik anlayışı henüz mükemmel değil; gösterilen bir demoda kayak yapan birinin karla olan etkileşimi tam olarak gerçeği yansıtmıyordu. Ayrıca, bir ajanın gerçekleştirebileceği eylemler kısıtlı ve model şimdilik sadece birkaç dakikalık sürekli etkileşimi destekliyor, oysa ki kapsamlı bir eğitim için saatler gerekiyor.

Buna rağmen Genie 3, yapay zeka ajanlarını basit tepkiler vermenin ötesine taşımak için güçlü bir adım. Bu teknoloji sayesinde ajanlar plan yapabilir, keşfedebilir ve deneme-yanılma yoluyla kendilerini geliştirebilirler.

DeepMind araştırmacısı Parker-Holder, bu durumu efsanevi Go oyuncusu Lee Sedol ile AlphaGo arasındaki maçta yaşanan ve yapay zekanın insan ötesi stratejiler keşfedebileceğini gösteren "Move 37" anına benzetiyor. Parker-Holder'a göre, fiziksel dünyada hareket eden ajanlar için henüz böyle bir an yaşanmadı. Ancak ekliyor: "Şimdi, potansiyel olarak yeni bir çağın kapılarını aralayabiliriz."