※ 본 게시물은 Pytorch 기초 강의 9. DQN 포스팅의 이해를 위해 작성한 부가 포스팅입니다. 강화학습(Reinforcement Learning) 강화학습 : 보상(reward), 처벌(penalty)를 미리 설계하고 스스로 환경을 경험하며 학습(from.포스팅) = 환경과 상호작용하여 좋은 점수를 얻는 방향으로 성장 = 사람은 목표를 설정해주고 당근과 채찍을 이용해 성장시키는 코치의 역할 강화학습의 구성요소 1. 에이전트(agent) : 인공지능 플레이어 2. 환경(environment) : 에이전트가 솔루션을 찾기 위한 무대 3. 행동(action) : 에이전트가 환경 안에서 시행하는 상호작용 4. 보상(reward) : 에이전트의 행동에 따른 점수 혹은 결과 강화학습의 사례 - 알파고 - 로..
※ 본 게시물에 사용된 내용의 출처는 대다수 에서 사용된 자료이며, 개인적인 의견과 해석이 추가된 부분도 존재합니다. 그림의 경우 교재를 따라 그리거나, 제 임의대로 추가 수정한 부분도 존재합니다. 저 역시도 공부하고자 포스팅한 게시물이니, 잘못된 부분은 댓글로 알려주시면 감사하겠습니다. +) 본 포스팅은 기초 RL 용어는 알고 있다는 전제 하에 작성하였습니다. RL에 대한 기초적인 정보는 다른 포스팅을 참고해주시기 바랍니다. Model-Based Algorithm vs Model-Free Algorithm Model-based algorithm : 환경에 대해 이미 다 알고 학습 - 환경(environment)에 대해 알고 있고, 행동에 따른 환경 변화를 아는 알고리즘 - 어떤 state에서 어떤 ac..
※ 본 게시물에 사용된 내용의 출처는 대다수 에서 사용된 자료이며, 개인적인 의견과 해석이 추가된 부분도 존재합니다. 그림의 경우 교재를 따라 그리거나, 제 임의대로 추가 수정한 부분도 존재합니다. 저 역시도 공부하고자 포스팅한 게시물이니, 잘못된 부분은 댓글로 알려주시면 감사하겠습니다. 인공지능과 머신러닝 인공지능 : 인간의 사고를 인공적으로 모방한 모든 것 머신러닝 : 주어진 데이터를 갖고 통계학적인 모델을 학습시켜 인공지능을 구현하는 방법 딥러닝 : 머신러닝의 수많은 학습법 중 하나 딥러닝 학습 종류에는 크게 다음과 같이 나뉠 수 있음. 지도학습(Supervised Learning) : 데이터-데이터 라벨(입력 - 출력)쌍이 미리 정의된 데이터로 학습하는 경우 비지도학습(Unsupervised Le..