'강화학습' 태그의 글 목록

[OpenAI Spinning Up] Introduction to RL / Part 1: Key Concepts in RL

📌프로그래머스 인공지능 데브코스 6기 강화학습 스터디 Open AI spinning up - Introduction to RL Key Concepts and Terminology 에이전트-환경 상호작용 루프 강화학습은 에이전트(agent)가 주어진 환경(environment)에서 어떻게 시행착오(trial and error)를 통해 학습하는지에 대한 연구이다. 환경은 에이전트가 살고 상호작용하는 세계이다. 에이전트는 환경으로부터 리워드(reward)를 받는다. 리워드란 현재의 상태가 얼마나 좋고 나쁜지를 알려주는 척도이다. 에이전트의 목표는 누적 리워드 리턴(return)을 최대화하는 것이다. 강화학습은 이 목표를 달성할 수 있는 행동을 배우는 방법이다. Terminology States and Obse..

카테고리 없음 2023.10.03

« 2025/05 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

대학원생의 공부노트

강화학습 2

티스토리툴바