PEGGA Yazılım ve Web Hizmetleri olarak sizleri dijital çözümlere ulaşmanıza öncülük ediyoruz.

İletişim

Location

Şekerhane mah. Ali İmam sk. No:37 PEGGA Yazılım, Alanya/Antalya

Singapur Teknoloji ve Tasarım Üniversitesi’nden (SUTD) araştırmacılar, karmaşık hareket tasarımını anlamak için tasarlanmış takviyeli öğrenme ve faz değişim belleği etrafında şekillenen yeni bir yazılım geliştirdi.

Daha önceki çalışmalar bu tür derin öğrenmeyi satranç veya Go gibi diğer oyunlara uygulamıştı, ancak araştırmacılar bunun yerine D-PPO algoritmasını Street Fighter Champion Edition II’nin zorluğuna karşı test etmeye karar verdi. SUTD araştırmacıları, SF-R2 yapay zeka oyuncusunu, bilgisayara karşı iki gün üst üste oynayarak eğitti. Daha sonra yapay zeka, bir Street Fighter şampiyonunu yenmeyi başararak kendisinden bekleneni yerine getirdi.

Araştırma makalesine göre, bu çalışma hareket bilimi için daha geniş kapsamlı sonuçlar içeriyor. Örneğin robotik ve otonom araçların geliştirilmesinde önemli bir rol oynayabilir. Ayrıca makinelerin insan normlarını gözlemleyebileceği ve bunları taklit etmeye ve daha iyi performans göstermeye çalışabileceği alanlarda geniş çapta uygulanabilir eğitimin de önünü açıyor.

Yapay zeka araştırmacılarının geliştirdikleri sistemlerin etkinliğini ölçmek için kullandıkları en yaygın yöntemlerden biri, bu sistemleri farklı oyun türlerinde insan oyuncularla yarıştırmak. 2017 yılında DeepMind tarafından geliştirilen bir Alpha Go yapay zekası, bir önceki yıl Fan Hui’ye karşı kazandığı ilk zaferin ardından ikinci kez dünyanın bir numaralı insan Go oyuncusunu yendi. Microsoft’un yapay zekası Haziran ayında dünyanın ilk kusursuz Ms. Pac-Man skorunu elde etti ve Ağustos ayında bir OpenAI motorunun zamanın en iyi Dota 2 oyuncularını yendiğini gördük.

Bir Street Fighter şampiyonunu yenerek elde edilen bu son başarı, takviyeli öğrenmenin yanı sıra faz değişimli bellek sayesinde mümkün oldu. İlk olarak HP tarafından geliştirilen bu bellek, kalkojenit cam üzerindeki alanları değiştirmek için elektrik yükleri kullanılarak elde edilen bir tür uçucu olmayan bellek türü. Yani yaygın olarak kullanılan Flash bellekten çok daha hızlı.

Baş araştırmacı Desmond Loke TechXplore’a yaptığı açıklamada “Yaklaşımımız benzersiz çünkü en iyi insan oyuncularınkinden daha iyi performans gösteren hareketler yaratma konusunu çözmek için takviyeli öğrenmeyi kullanıyoruz. Bu, önceki yaklaşımları kullanarak mümkün değildi ve yaratabileceğimiz hareket türlerini dönüştürme potansiyeline sahip” dedi.

Yorum Yap

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir