Súbor:Clanok-Kognitivna-mapa-bludiska.pdf
V učení posilňovaním sa využíva model čiastočne pozorovateľných Markovovských rozhodovacích procesov. Zvyčajne sa predpokladá, že agent má predpripravený model sveta (jeho stavov), ktorý na základe pozorovaní a zvolenej stratégie ohodnocuje a na jeho základe vykonáva akcie. V príspevku sa zaoberáme problémom, či je model sveta možné vytvoriť na základe pozorovaní, aby si ho agent mohol odvodiť sám a nemusel byť explicitne zadaný. Zadefinujeme problém vytvorenia Markovovského modelu. Ukazujeme teoretické obmedzenia a demonštrujeme riešenie pomocou gramatickej indukcie pre zjednodušený prípad s aplikáciou pre problém bludiska. Vytvorený model je vhodný najmä pre využitie v učení posilňovaním.
File history
Click on a date/time to view the file as it appeared at that time.
Date/Time | Dimensions | User | Comment | |
---|---|---|---|---|
current | 19:18, 31 May 2011 | (236 KB) | Maly (Talk | contribs) | V učení posilňovaním sa využíva model čiastočne pozorovateľných Markovovských rozhodovacích procesov. Zvyčajne sa predpokladá, že agent má predpripravený model sveta (jeho stavov), ktorý na základe pozorovaní a zvolenej stratégie ohod |
- You cannot overwrite this file.
File usage
There are no pages that link to this file.