2022-02-14 신주용 세미나

예전엔 동적계획법을 많이 사용했지만 강화학습으로 넘어가는 이유는문제복잡도와 상태가 많기 떄문에 가치함수를 모두 구할 수 없음기존의 방식으로는 풀 수 없음강화학습은 샘플링을 통해서 일부의 가치함수만 구해서 함