Cieľom spoločnosti bolo pre svoju existujúcu umelú inteligenciu vytvoriť systém učenia, ktorý by sa najväčšmi podobal tomu využívanému ľuďmi. Teda, aby bol čo najefektívnejší. Vďaka novým algoritmom je umelá inteligencia od OpenAI schopná trénovať sama seba. Minulý týždeň však vedci prišli s algoritmom, ktorý mal tento systém posunúť ešte o čosi bližšie k dokonalosti.
Celý zázrak spočíva v tom, že počítač dostane nejakú úlohu, no postup k jej úspešnému dokončeniu nepozná. Jeho úlohou je naučiť sa ho. V novom algoritme má počítač k dispozícii virtuálneho agenta, ktorý „dohliada“ na jeho postup. Umelá inteligencia je tak schopná sama so sebou konzultovať výsledky. Pokiaľ sa jej úlohu nepodarí doviesť dokonca, no popri tom sa naučí niečo iné, zapíše si to ako úspech.
Interpretable Machine Learning through Teaching: https://t.co/7nrIbVWs2u
— encouraging neural network-based agents to transfer concepts to each other via human-understandable examples. pic.twitter.com/2l9G6G3whU— OpenAI (@OpenAI) February 15, 2018
Veľmi podobným spôsobom sme sa aj my v detstve učili bicyklovať. Je jasné, že keď si po prvýkrát sadnete na bicykel, nie ste hneď šampiónom. Postupom času sa však učíte z vlastných chýb. Aj keď je vašim cieľom bicyklovať perfektne, najprv sa musíte naučiť udržať rovnováhu a až potom môžete začať zlepšovať rýchlosť, výkonnosť a podobne. V novom algoritme je zahrnutý aj systém odmien.
Pokiaľ umelá inteligencia úspešne splní svoju úlohu, dostane virtuálnu sušienku a vie, že si počínala dobre. Existujú však dve metódy tejto výučby. V prvej dostal počítač odmenu až potom, čo úlohu dokončil. Ak ju nedokončil nedostal nič. Pri druhej metóde dostal sušienku vždy, keď svojim pokrokom o čosi viac priblížil k úspešnému výsledku. Obe metódy však nie sú dokonalé, keďže pri prvej počítač strácal veľa času zbytočnosťami a druhú je ťažké presadiť v praxi.
Vďaka virtuálnemu agentovi zvanému HER sa však dokážu počítače učiť spôsobom podobným človeku. Keďže sa majú komu spovedať so svojimi chybami, dokážu sa učiť rýchlejšie a efektívnejšie.
sciencealert.com
Nahlásiť chybu v článku