reinforcement-learning
문서
실습 및 Q&A
1일차 - 기본 개념
시작하기
강화학습이란 무엇인가
기본 용어
gymnasium
할인
가치
2일차 - 추정과 탐색
동적 계획법
부트스트랩
MAB
몬테카를로
3일차 - 제어와 딥러닝
시간차 학습
제어 문제
딥러닝
4일차 - 심층 강화학습
가치 기반 강화 학습
경험 리플레이
정책 경사
Actor-Critic
실무 적용 방안
5일차 - 최근 동향
[사례] 선박 제어
PPO
off-policy 정책 경사
알파고
다른 방법들
챗봇
문제점
reinforcement-learning
Next
실습 및 Q&A