reinforcement-learning
기본 개념
강화학습의 역사
강화학습의 주요 개념 및 용어 소개
강화학습의 적용 분야 예시
탐색과 활용의 딜레마
탐색 전략
마르코프 결정 과정(MDP)
동적 프로그래밍
가치 반복과 정책 반복
몬테 카를로 방법을 이용한 강화학습
시간차 학습(Temporal-Difference Learning)
SARSA 알고리즘
Q-러닝
최신 모델
심층 Q-네트워크(DQN)
DQN의 심화
정책 경사 방법 및 REINFORCE 알고리즘
액터-크리틱 방법
A2C 및 A3C 알고리즘
심층 결정론적 정책 경사(DDPG)
소프트 액터-크리틱(SAC)
TRPO
PPO
이슈
MCTS
강화학습의 안정성과 일반화
멀티 에이전트 강화학습
강화학습의 어려움
reinforcement-learning
Next
강화학습의 역사