Trend AGI를 목표로 하는 강화학습

AGI를 목표로 하는 강화학습

[선행연구팀 최현우] 지난 5월 딥마인드는 ‘Reward is Enough’라는 제목의 강화학습 논문을 발표했습니다. 저자들은 ‘포만감을 높이려는 다람쥐’와 ‘청결을 유지하려는 주방로봇’의 예시를 들어, 적절한 보상이 정의된다면 이를 극대화하는 과정에서 지능과 관련된 (인지,…