OpenAI uzmanları, Minecraft’ı insan oyuncular kadar yüksek standartta oynayan bir hudut ağını eğitti. Sinir ağı, klavye ve fare girişlerinin de kaydedildiği, yüklenicilerin muhakkak oyun içi vazifeleri gerçekleştirdiği küçük bir görüntü veritabanıyla desteklenen 70.000 saatlik çeşitli oyun içi imajlar ile eğitildi.
İnce ayardan sonra OpenAI, modelin yüzmeden hayvan avlamaya ve etlerini tüketmeye kadar her türlü karmaşık beceriyi gerçekleştirebildiği gördü. Tıpkı vakitte, oyuncunun yükselmek için sıçrarken altına bir materyal bloğu yerleştirdiği bir hareket olan “sütun tırmanmayı” da kavradı.
Belki de en etkileyici olanı, yapay zeka, OpenAI’nin bir bilgisayar ortacısı için gibisi görülmemiş bir muvaffakiyet olarak tanımladığı, sırayla yürütülmesi gereken uzun bir dizi aksiyonu gerektiren elmas araçları üretebildi.
Minecraft projesi, şirketin Görüntü PreTraining (VPT) olarak isimlendirilen AI modellerinin eğitiminde OpenAI tarafından kullanılan yeni bir tekniğin işe yaradığını kanıtladığından ötürü büyük kıymet taşıyor.
Geçmişe bakıldığında, yapay zeka modellerini eğitmek için bir kaynak olarak ham görüntüyü kullanmanın en büyük zorluğu, olanların anlaşılması için gereğince kolay olmasıydı, fakat bu görüntü eğitimleri sonuçların nasılını öğretmiyor. Gerçekte, AI modeli istenen sonuçları emiyor, fakat bunlara ulaşmak için gereken girdi kombinasyonlarını kavrayamıyor.
Ancak VPT ile OpenAI, temel modeli oluşturmak için ilgili klavye ve fare hareketleriyle etiketlenmiş, ihtimamla seçilmiş bir manzara havuzuyla halka açık web kaynaklarından alınan büyük bir görüntü data kümesini eşleştiriyor.
Ekip, temel modelde ince ayar yapmak gayesiyle belli vazifeleri öğretmek için tasarlanmış daha küçük data kümelerini ekler. Bu manada, OpenAI, ağaçların kesilmesi ve üretim istasyonları inşa edilmesi üzere erken oyun aksiyonlarını gerçekleştiren oyuncuların imajlarını kullandı. Bunun, modelin bu misyonları yerine getirebildiği güvenilirlikte “büyük bir gelişme” sağladığı söyleniyor.
Bir başka teknik, pekiştirmeli öğrenme olarak bilinen bir uygulama olan bir dizi vazifedeki her adımı başarmak için AI modelini “ödüllendirmeyi” içeriyor. Bu süreç, hudut ağının insan seviyesinde bir muvaffakiyet oranına sahip olarak bir elmas kazma üretebilmek için tüm gereçleri toplamasını sağladı.
OpenAI tarafından gönderilen bir blog yazısında “VPT, sırf lisandan daha fazla alanda direkt büyük ölçekli davranışsal öncelikleri öğrenmenin heyecan verici mümkünlüğünü sunuyor. Sırf Minecraft’ta deneyler yapsak da, oyunun ucu çok açık ve lokal insan arayüzü (fare ve klavye) çok genel, bu nedenle sonuçlarımızın öteki emsal alanlar, örneğin bilgisayar kullanımı için düzgüne işaret ettiğine inanıyoruz.“