Reinforcement Learning a Robotikában Workshop

2024.08.05.
Reinforcement Learning a Robotikában Workshop
A Védelmi Innovációs Kutatóintézet (VIKI) az ELTE Informatikai Karával együttműködésben ingyenes nyílt kurzust hirdet a négy lábú robotok AI-alapú szabályozásának témakörében. A kétnapos előadássorozaton a hallgatóság megismerheti a modern robotirányítás és a megerősítéses tanulás alapjait, illetve ezek kapcsolatát.
Az előadássorozatot követően a résztvevők jelentkezhetnek a VIKI által hirdetett szimulátoros robotikai versenyre, ahol újonnan szerzett tudásukat a gyakorlatban is kamatoztathatják egy Unitree Go2 robot irányításában.
 
Időpont, helyszín
2024. augusztus 27-28. (kedd-szerda) 9:30-19:00
ELTE Informatikai Kar, Lágymányosi Campus, 1117 Budapest, Pázmány Péter sétány 1/A. -1.75 Konferenciaterem (Az Infopark mellett)
 
Jelentkezés
A részvétel mindenki számára nyílt, ingyenes, de regisztrációhoz kötött.
 
A kurzuson való részvétel nincs előtanulmányokhoz kötve, ugyanakkor a kurzus anyaga programozási, mechanikai és matematikai (lineáris algebra, valószínűségszámítás) alapismeretekre épít, alapvetően mérnöki és informatikai területek hallgatóinak, szakembereinek ajánlott, akik szeretnék bővíteni tudásukat a robotika és a mesterséges intelligencia területén.
 
Kérdéseket, észrevételeket az alábbi e-mail címre várunk: info@inf.elte.hu
 
Jelentkezési határidő
2024. augusztus 26.
 
Kurzus leírás
A közelmúltban a modellprediktív szabályozók helyét mély megerősítéses tanuláson alapuló szabályozók vették át a robotika élvonalában. Gyorsított kurzusunkon megismerkedünk a mély megerősítéses tanulás elméleti és gyakorlati alapjaival; a VIKI versenyfeladatára velünk tartó hallgatóink kiscsoportos versenyfeladat keretében egy négylábú robot szabályozóját készíthetik el. A betanított szabályozókat egy szimulált akadálypályán mérjük össze a kurzus végén, a jól teljesítő csapatok pedig az igazi robotunkon a VIKI által biztosított Unitree Go2 Edu-n is kipróbálhatják azokat az ősszel szervezett döntőn.
 
A kétnapos jelenléti oktatás során az anyag elméleti alapjait vázoljuk fel, és gyakorlati kontextusban áttekintjük a használt technológiákat. A versenyfeladat megoldási szakaszban ezután az anyag elméleti és gyakorlati részleteit egy videókurzuson keresztül támogatjuk, így a feladatmegoldás közben könnyen kereshetők a részletek.
 
 
Tematika
 

Időpont

2024. augusztus. 27. kedd

2024. augusztus 28. szerda

 

 

Motiváció, az RL alapjai

 

Modern RL, RL a robotikában: esettanulmányok

 

9:30-12:30

Modern robotika gyors bemutatása
Hagyományos robotirányítás: PID, MPC, optimal control
RL alapjai: MDP-k, Bellmann egyenlet, diszkrét állapot-akció tér
Policy és value function
Exploration/exploitation, ε-greedy, Rmax
Model-based és model-free RL.

Naív policy gradient módszerek
TRPO, PPO alapjai
Megerősítéses tanulás részletes esettanulmányai a robotikában
RL és MPC gyakorlati összehasonlítása.

 

Klasszikus RL, Deep RL

Kitekintés: mély tanulás a robotikában

Ebédszünet

 

14:00-16:00

 

RL alapfogalmak: Bellmann-egyenlet, ε-greedy, Rmax, model-based és model-free RL
Q-learning, TD-Learning, parametrikus Q/V függvények, Deep Q learning
DQN, Double DQN, Policy search: REINFORCE, Naive PG, TRPO, PPO.

Behavioural Cloning, Diffusion módszerek
Nem RL-alapú áttörések a robotikában
Manipuláció és járás tanulásalapú megközelítései.

Kávészünet

 

A Robotika rövid története: ismeretterjesztő előadás

Versenyfeladat kihirdetése

16:30-19:00

Unitree Go2 robot megtekintése

Szakmai háttér nélkül is érthető ismeretterjesztő előadás
Robotika fejlődése: manipulátorok, popkulturális hatások, irányítástechnika
Modern robotika: drónok, négylábú robotok, humanoid hype, az AI-hype hatása.

Szimulált akadálypálya bemutatása
Gyakorlati tippek jelentkezőknek
Csapatok véglegesítése

 

Előadók

 Forrai Benedek

Forrai Benedek a BME-n szerzett mechatronikai mérnöki alapdiplomát, villamosmérnöki mesterképzését az ETH Zürichen a Stipendium Peregrinum ösztöndíj támogatásával végezte, ahol később kutatómérnökként tanulásalapú robotikával foglalkozott. Jelenleg az ETH Soft Robotics laborjából induló, manipulációs modellekre és imitációs algoritmusokra alapuló Mimic Robotics AG robotikai mérnöke és társalapítója. A Mimic csapatával közel 1.1 milliárd forintnyi befektetést szereztek arra, hogy elérhetővé tegyék a humanoid robotika vívmányait a kiskereskedelemben, az élelmiszer- és vendéglátóiparban. Benedek emellett a Védelmi Innovációs Kutatóintézet robotikai tanácsadója, ahol négylábú robotokkal és reinforcement learninggel kapcsolatos kutatásokat végez.

 Tihanyi Dániel

Tihanyi Dániel a BME-n szerzett mechatronikai mérnöki alap-, illetve az ETH Zürich-en robotikai mesterdiplomát. Szakterülete a szabályzáselmélet és az autonóm robotika. Fő karrierfókusza az elméleti akadémiai kutatás, valamint szakmai oktatás módszereink modernizálása. Összesen több mint 4 év egyetemi, tantermi és magánoktatási, illetve tananyagfejlesztési tapasztalattal rendelkezik. Filozófiája az emberközpontú és mentori megközelítésre épül. Célja a diákélmény javítása, melyet támogató, de kihívásokkal teli környezet teremtésével kíván elérni.