반응형
강화학습 알고리즘의 큰 줄기를 차지하고 있는 Multi-armed bandit problem에 대한 내용입니다.
동영상에서는 Multi-armed bandit problem이 어떤 목적을 지니는지, 그 알고리즘은 어떻게 생긴건지에 대한 개념을 정리한 영상입니다.
영상 목차
- Multi-armed bandit problem (MABP)이란 무엇인가?
- Stochastic, Non-stochastic, Markovian MABP 모델 설명
- MABP 알고리즘인 Exp3
반응형
'정보공유 > 인공지능' 카테고리의 다른 글
아마존의 인공지능 비서 (0) | 2017.11.06 |
---|---|
음성 인터페이스와 스마트 스피커 (0) | 2017.11.04 |
인공지능 음성 서비스 와 디지털 콘텐츠 산업 (0) | 2017.10.29 |
2017 글로벌 인공지능 스타트업 (0) | 2017.10.17 |
돌핀어택(DolphinAttack) (0) | 2017.09.07 |