Ez így persze egyszerűnek hangzik, valójában kicsit bonyolultabb.
Az OpenAI az elmúlt években azon dolgozott, hogy megnézzék, a virtuális térben ki tudnak-e fejleszteni egy sokkal intelligensebb, kifinomultabb mesterséges intelligenciát. Az alapelv az volt, amit ma tudunk az egyedfejlődésről, hogy mikroszkópikus életformákból évmilliárdok alatt, az életben maradásért való verseny következtében váltunk a ma ismert emberi fajjá. Az egyik oldalon a többágenses tanulás (multi-agent learning) a másik oldalon pedig a megerősítéses tanulás (reinforcement learning) vívott ádáz küzdelmet egymással, miközben egymást is tanították. Előbbi megoldás több különböző algoritmust versenyeztet a legjobb megoldás érdekében, utóbbi pedig nagy számú próbálkozásból, a sikeres és sikertelen nekifutásokból tanulja meg elérni a kitűzött célt.
Az OpenAI ezeket versenyeztette egymással több százmillió körön keresztül, és figyelemmel kísérték, hogy alakulnak ki a legkomplexebb megoldások, a virtuális térben történő eszközhasználattal együtt. Egy olyan zárt teret „építettek” az AI karakterek számára, amelyekben a két csapat dolga mozgatható és nem mozgatható tárgyak, illetve különféle rámpák felhasználásával bújócskázni. Az egyik csapatot „büntették/jutalmazták,” attól függően, hogy sikeresen bújtak-e el vagy megtaláltak-e mindenkit, aki elbújt. Azon kívül, hogy meg kellett találniuk a másikat, egyéb utasításokat nem kaptak.
500 millió kör után már mindkét csapat tucatnyi stratégiát tanult meg. Kezdetben nem tologatták a mozgatható objektumokat, csak megpróbáltak elbújni minden mögött, nyilván kevés sikerrel, de a 25 milliomodik kör után már a bújók erődöt építettek maguk köré a barikádokból és dobozokból, és ehhez még együtt is működtek, hogy minél gyorsabban végezzenek az építkezéssel.

További 50 millió kör után a keresők rájöttek arra, hogy a rámpák mozgatásával felmászhatnak az építményekre, és megtalálhatják az elbújt ellenfeleiket, a 85 milliós határnál pedig már azt is kitapasztalták, hogyha a dobozokat mozdíthatatlanná teszik azzal, hogy eltorlaszolják a bejáratokat, az ellenfél nem tudja felhasználni. Ezután olyan fordulat jött, amire az AI kutatók nem számítottak: a 380 milliomodik kör környékén a keresők rájöttek, hogy ha egy lezárt rámpán felmásznak egy mozgatható dobozra, bejuthatnak a bújók által teljesen eltorlaszolt erődítménybe. A bújók pedig egy idő után ezt is kiküszöbölték.
Nem mondtuk nekik, hogy menjenek oda a dobozokhoz, és használják fel őket. A többágenses versenyben egymásnak adtak új feladatokat, hiszen a megtanult stratégiákhoz a másik csapatnak alkalmazkodnia kellett
mondta az MIT Technology Review-nak Bowen Baker, az eredményeket bemutató tanulmány egyik szerzője.
Kapcsolódó:
Valószínűleg MEGVAN, miért hibázik a Tesla amikor villogó hatósági járművel találkozik
Az amerikai Országos Közúti Közlekedésbiztonsági Hivatal vizsgálatot indított, a Tesla Y, X, S és 3-as modellek baleseteinek esetében, miután 17 ember megsérült, egy pedig meghalt, mert az önvezető funkcióval közlekedő járművek nekiütköztek rendőr, mentő vagy tűzoltóautóknak.
(Forrás: Qubit | Borító: dataidedesign.com)