▲ 송지현 스마일게이트 AI센터 연구원.
브레이크뉴스 임국정 기자 = “그 이전에는 좀 무관한 조경 관련 전공을 했어요.”
송지현 스마일게이트 AI센터 연구원에게 학부 때 전공을 물었더니 예상 외 답변이 돌아왔다. 송 연구원은 연세대학교 산업공학과(스마트시스템 연구실) 석사, 넷마블 IGS AI 센터 자연어 담당, 넷마블 에프엔씨 지표·분석팀 데이터분석 담당을 역임했다. 당연히 학부에서도 컴퓨터 과학 등 AI 관련 전공을 했을 거라는 예상은 보기 좋게 빗나갔다.
그는 인공지능(AI)을 공부하게 된 이유를 이렇게 설명했다. 석사 전공 당시인 2015년에는 스마트팜(첨단 기술을 접목해 농장 생산성을 높이는 시스템) 열풍이 불었고, 조경에서도 빅데이터 분석, AI를 접목하는 사례가 늘어났다. 그렇게 AI에 관심을 가지게 됐고, 산업공학 석사 과정에 진학해 빅데이터 분석과 텍스트 마이닝을 공부했다. 현재는 주로 자연어 처리 분야를 연구하고 있다. 자연어 처리는 컴퓨터를 이용해 자연어(사람들이 일상적으로 쓰는 언어)를 분석하고 처리하는 기술을 말한다.
이처럼 독특한 이력을 가진 송 연구원은 현재 스마일게이트 AI센터(이하 AI센터)에서 일하고 있다. AI센터는 최근 AI 언어 모델 평가 플랫폼 ‘휴릭’(HuLiC, Human Like AI Conversation)을 공개했다. AI센터에서 가상인간연구팀 NLU(자연어 이해) 연구 및 대화 모델 분석을 담당하고 있는 송 연구원은 휴릭 프로젝트에 핵심 연구원으로 참여했다.
스마일게이트는 다중접속역할수행게임(MMORPG) ‘로스트아크’를 제작한 게임 개발사로 잘 알려져 있다. 왜 게임사 소속 AI센터가 언어 모델 평가 플랫폼을 만들었을까. 송 연구원을 스마일게이트 사옥이 있는 판교에서 만나 자세한 얘기를 들어봤다.
휴릭 플랫폼, 사람이 언어 모델 직접 평가
AI 센터는 2019년 설립됐다. 스마일게이트 엔터테인먼트 계열사다. 게임 내에서 사용되는 AI뿐 아니라 가상 인간, 음성 합성 등 엔터 산업에 적용할 수 있는 다양한 AI를 개발하고 있다.
센터 설립 초기, 구성원들은 가상 인간을 만들기 위해 무엇을 잘해야 할까를 생각했다. 고민 끝에 내린 결론은 ‘대화’였다.
“정형화된 질문에 답하는 ‘클로즈드 도메인 챗봇’은 은행이나 커머스 같은 데서 이미 너무 많이 상용화돼 있었어요. 그런데 저희가 원하는 것은 엔터테인먼트 쪽에 초점을 맞추다보니 사람처럼 재미있게 대화를 잘하는 것에 대해 고민하기 시작한 거죠.”
© 스마일게이트 |
휴릭 프로젝트는 이렇게 점차 구체화되기 시작했다. AI센터가 최근 공개한 휴릭은 AI에 기반한 다양한 언어 모델을 평가·연구하며 그 결과를 공유하는 평가 플랫폼이다. 실제 인간처럼 상호 작용할 수 있는 AI 언어 모델을 만들기 위해 데이터를 구축하고 평가한다. 오픈 도메인을 지향하며 외부에서 공유·참고할 수 있도록 고안돼 있다.
특히 휴릭은 실제 전문가가 참여해 사람만이 평가 가능한 지표를 토대로 언어 모델을 평가한다. 자동화 방식으로 진행되는 기존 평가와 비교했을 때 가장 큰 차이점 중 하나다. 언어 모델을 연구하는 사람이면 누구나 평가를 요청할 수 있다.
우선 평가 요청자가 정해진 기준에 맞춰 모델을 등록하면, AI센터 연구원들이 기본 수준이 되는지를 살펴본다. 기준 이상의 모델은 또다시 소규모 테스트를 거친 뒤에야 대규모 테스트의 대상이 된다. 대규모 테스트에서 전문가들은 선별된 언어 모델과 자유롭게 대화를 나누고, 그렇게 쌓인 대화 내용을 상호 평가하는 과정을 통해 점수로 객관화한다.
송 연구원은 “20명 이상의 전문가들이 항목별 평가를 진행하고, 그 결과를 분석해 리포트까지 전달한다”고 설명했다.
“휴릭, 한국의 캐글 꿈꿔”
크게 봤을 때 휴릭 프로젝트는 시작 단계라고 할 수 있다. 현재 휴릭은 ‘일상 대화’가 주제다. 사람과 언어 모델이 얼마나 대화를 자연스럽게 잘 주고받는지를 평가한다. AI센터는 앞으로 휴릭을 언어 모델이 얼마나 윤리적이고 지식이 많은지, 얼마나 비주얼 측면에서 보기 좋은지 등 다양한 기준에 대해 평가하는 플랫폼으로 발전시킬 계획이다. 송 연구원은 “휴릭은 계속 상시 오픈이다”며 “태스크(과업)만 계속 바뀌게 색깔을 입힐 생각이다”고 밝혔다.
이미 AI센터는 휴릭에 앞서 지난 1월 AI 윤리성 연구를 위한 악플 및 혐오 발언 데이터 셋을 공개하기도 했다. 온라인 공간에서 광범위하게 증가하고 있는 악플 및 혐오 표현을 감지하고 대응하기 위해서다. 앞으로 이러한 데이터를 기반으로 휴릭에서 윤리·혐오 등에 대해 언어 모델을 평가할 계획이며, 이 역시 사람이 직접 평가하는 과정을 거칠 방침이다.
AI센터는 궁극적으로 휴릭을 대화뿐 아니라 도덕성, 전문 지식 등 다양한 부분을 평가할 수 있는 평가 플랫폼으로 만드는 목표를 가지고 있다. 동종 업계 사람들, 연구하는 학생들 등이 다양한 연구 분야에 활용할 수 있는 평가 플랫폼을 꿈꾼다. 송 연구원은 데이터 전문가 커뮤니티이자 가장 유명한 온라인 AI 경진대회 플랫폼인 캐글을 예로 들었다.
“해외에는 캐글이라는 평가 플랫폼이 있어요. 내가 모델링 해서 업로드하면 자동으로 몇 위인지 순위를 매겨주죠. 그래서 항상 계속 열려 있거든요. (그리고 연구한 내용들을 서로 공유하는) 그런 식의 플랫폼을 국내에서는 저희가 만들어 보려 합니다.” redsummer@kakao.com
기사출처: 조경 공부하다 AI 연구…”휴릭, 한국의 캐글 꿈꿔”, <브레이크뉴스>, 2022/04/27 15:25, https://www.breaknews.com/890824 (2022/05/18)