10년전 게임과 현재의 게임을 비교해 보면, 특히 그래픽 측면에서 많은 차이가 있습니다. 예를 들면, 4K 이상의 해상도, 정교한 그래픽 텍스춰, 자연스러운 3D 모델 애니메이션, 물리 엔진, 광원 엔진 등 수 많은 부분들이 개선되어 점차 게임 환경은 현실 세계와 유사해지고 있습니다. 하지만 게임 내 오브젝트들과의 상호 작용이라는 측면에서 보면 아직 현실 세계와는 큰 차이가 있습니다. 물론 최근에는 다중 분기를 지원하는 스토리라인과 상황에 맞게 여러 가지 행동을 하는 NPC AI가 도입되는 추세이지만 아직 미리 짜여진 규칙 기반의 스크립트에서 크게 벗어나지 못하고 있는 것이 사실입니다.
OpenAI의 GPT-3는 기존 기술 대비 월등하게 풍부하고 자연스러운 대화를 생성할 수 있다는 것을 여러 사례를 통해 증명해 오고 있습니다. ModBox는 멀티플레이어 샌드박스 게임으로 다수가 즐길 수 있는 온라인 게임을 유저가 직접 만들어서 플레이해 볼 수 있도록 구성되어 있습니다. 이 ModBox를 이용하여 간단한 길거리 환경을 만들고, 등장하는 NPC에 음성 인식기, GPT-3, 음성 합성기를 붙여서 제작한 데모가 공개된 것이 있어서 이를 공유합니다.
데모에서 확인할 수 있듯이, 기존 게임에 비해 좀 더 인간과 가까운 형태의 대화를 나누어 볼 수 있습니다. 개인적으로는 게임 내에서의 상호 작용 또한 현실 세계와 유사하게 발전할 것으로 생각되며, 이 과정에서 대화형 AI는 큰 부분을 차지할 것 같습니다. 최근 딥러닝 기반의 super resolution 기술이 최신 NVidia GPU를 통해 지원되는 등 AI 기술이 점차 게임에서 활용되고 있는 추세입니다. 향후 물리 엔진, 광원 엔진에 이은 지능 엔진이 게임에 도입될 것으로 예측합니다.
다만, 미래의 게임이 다 이런 방식으로 바뀔 것인가에 대해서는 고민해 볼 지점들이 많이 있습니다. 예를 들어 MMORPG의 NPC들은 대부분 대화 상대라기 보다는 퀘스트를 주거나 장비를 판매하는 등 일종의 기능을 수행하는 것이 보통입니다. 이러한 NPC들에 고도화된 대화형 AI를 도입하는 것이 과연 최종 사용자 경험에 도움이 될 것인지는 향후 재미있는 고민거리가 될 수 있을 것 같습니다. 게임과 같이 사용자의 수가 많은 분야의 경우 GPT-3와 같은 복잡한 알고리즘을 적용하는 것이 어렵고, 결국 사용자 기기에서 직접 동작되는 AI 형태로 가야합니다. 카운터스트라이크의 경우 동시접속자가 100만을 넘는데, 이들이 동시에 GPT-3 API를 호출하는 상황을 생각해보면 사업적 가치를 갖기가 거의 불가능할 것이기 때문입니다.
위 영상 링크가 포함되어 있는 블로그 글을 공유합니다: