Intel i deepsense.ai – polski projekt na rzecz rozwoju sztucznej inteligencji
Obserwując rozwój sztucznej inteligencji można odnieść wrażenie, że postęp dokonuje się głównie za Oceanem. Nic bardziej mylnego - pracują nad nim także inżynierowie z naszego kraju.
Polska firma deepsense.ai we współpracy z Intelem przeprowadziła eksperyment, którego efekty mogą przysłużyć się rozwojowi robotyki i autonomicznych systemów wspomagających człowieka na różnych polach. Z pomocą przyszły kultowe gry Atari, na których naukowcy testowali nauczanie sieci neuronowych metodą nagród i kar.
Bazując na eksperymencie przeprowadzonym w 2013 roku przez DeepMind Polacy postanowili stworzyć sieć neuronową, która sama nauczy się grać w proste gry - kultowe tytuły Atari, takie jak Breakout, River Raid czy Space Invaders. Cel? Sprawdzić, czy sztuczna inteligencja pracująca na procesorach Intela, ucząc się samodzielnie rozgrywania gier wideo, zdoła na tej samej zasadzie nauczyć się kierowania prawdziwymi robotami czy autonomicznymi pojazdami - pomagając ludziom w rozwiązaniu wielu problemów.
Początkowo algorytm nie ma pojęcia na czym polega gra i sam musi dojść do tego, jak grać aby wygrywać. Kluczowy jest system "kar" i "nagród", który pozwala komputerowi zorientować się, jaki rodzaj działań zbliża ją do celu, a jaki od niego oddala. Początki eksperymentu wyglądały dość zabawnie - np. w Breakoucie sztuczna inteligencja na oślep odbijała piłeczkę w różne strony, bardzo szybko przegrywając.
Cały system zbudowano w oparciu o standardowy serwer z procesorem Intel Xeon. W efekcie stworzony przez Polaków algorytm potrzebował mniej niż doby, by opanować grę na mistrzowskim poziomie i osiągać wyniki przewyższające możliwości ludzkich graczy. Niezbędne oprogramowanie współtworzyli inżynierowie z polskiego ośrodka badawczo-rozwojowego Intela w Gdańsku. Głównym celem było sprawienie, by program nie rozpraszał zadań na tysiące małych rdzeni, jak przy procesorach graficznych, ale optymalnie wykorzystał moc procesorów obliczeniowych Intel Xeon. Kolejnym krokiem było uruchomienie nauczania w systemach klastrowych. Pozwoliło to na skrócenie czasu nauki gry w River Raid czy Breakouta z 24 godzin do nawet kilkunastu minut.
Dlatego tak ważne są badania takie, jak te prowadzone przez deepsense.ai we współpracy Intelem. Opierają się one na wirtualnym, bezpiecznym środowisku oraz pozwalają na jednoczesne prowadzenie bardzo wielu powtórzeń i stałą optymalizację. Zdaniem ekspertów ciągu 10 lat na rynek trafią pierwsze powszechnie dostępne urządzenia wspomagające niepełnosprawnych, które wykorzystywać będą opisywane algorytmy uczenia się oparte na systemie nagród i kar.