728x90

Explore 2

[딥마인드 블로그] A generalist AI agent for 3D virtual environments

자연어 지시를 통해 다양한 게임에서의 task를 배울 수 있는 에이전트 Scalable Instructable Multiworld Agent (SIMA)에 대한 구글 딥마인드 블로그 포스트이다.  비디오 게임은 현실처럼 다양한 학습 환경을 제공하고 실시간이며 변화하는 goal을 제공해줄 수 있기 때문에 AI가 잘 작동하는지 확인하기 좋은 환경이다. 기존 연구들은 Atari game이나 스타크래프트 등 하나의 게임을 잘 하는 데 집중했다면 SIMA는 다양한 게임에 instruction을 통해 적응하도록 하였는데, 단순히 게임을 잘 하는가 보다도 어느 환경에서도 instruction을 따를 수 있는가가 더  중요했다고 한다. 이는 결국 어느 환경에서도 AI agent가 잘 작동하도록 하는 것과 연결되기 때문..

Explore 2024.10.24

[유튜브] Human-in-the-Loop Reinforcement Learning

2021 Ray Summit의 Pieter Abbeel 교수님 강연이다. https://www.youtube.com/watch?v=LEzdi-eJR8kFast Progress on Deep RL2013년 - 딥마인드의 DQN이 신경망이 human label이 아닌, 스스로 trial and error를 통해 학습할 수 있다는 것을 보여주었다. 2015년 - 알파고가 top human player를 이길 수 있음을 보여주었다.2016년 - 3D locomotion, robotic control을 배우고, real robot까지 적용: vision system + control system2019년 - OpenAI의 Rubik's Cube Challenge: Designing Suitable Reward에이..

Explore 2024.04.02
728x90