[선행연구팀 심홍매]
NAVER는 25일 개최한 ‘NAVER AI NOW’ 온라인 컨퍼런스에서 자체 개발한 한국어 판 GPT-3인 국내 최초의 ‘초대형 AI’ Hyper CLOVA를 처음 공개하였습니다.
영어 이외 언어 활용이 어려운 오픈 AI GPT-3와 달리 한국어에 특화된 것(한국어 능력)이 가장 큰 차이점이라고 합니다. Hyper CLOVA는 GPT-3보다 한국어 데이터를 6500배 이상 학습하였으며 GPT-3는 영어가 학습 데이터의 대부분을 차지하였다면 Hyper CLOVA 학습 데이터는 한국어 비중이 97%에 달합니다. 또한 Hyper CLOVA는 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터(parameter, 매개변수) 규모로 개발되어 더욱 많은 문제를 해결할 수 있게 되었습니다.(참고: 그림 1)
성낙호 네이버 클로바 CIC 비즈AI 책임리더는 “Hyper CLOVA는 우리말을 가장 잘 이해하고 구사할 수 있는 최초의 초대형 한국어 AI”라며 “데이터 셋을 별도로 구축하지 않아도 연결된 대화가 가능하다. 이용자가 굳이 모든 문장을 완벽하게 구사해서 내 의도를 전달하지 않아도 편하게 대화할 수 있는 수준”이라고 하였습니다.
컨퍼런스에서는 Hyper CLOVA의 다양한 능력을 보여주기 위한 여러 활용 사례들이 소개되었는데요, 첫번째로 소개한 사례는 바로 맥락을 이해하고, 공감을 보여주는 대화였습니다. Hyper CLOVA에서는 매우 자연스러운 연결된 대화가 가능하며 이러한 대화 시스템을 구성하기 위해서 별도의 데이터 셋을 제작할 필요가 없었다는 것이 주목할만한 지점이였습니다. 인공지능이라고 하면 보통 딱딱하고 기계적인 이미지를 연상하기 마련인데 Hyper CLOVA는 사용자의 만족감을 인지하고 호응하는 등 대화의 맥락 안에 숨어있는 다양한 디테일 한 요소들도 캐치한다는 장점이 있습니다. (참고: 그림 2 -왼쪽) 이외에도 문장에 담긴 감정을 분석하는 사례도 소개되었는데요, 목적을 한 문장으로 적고 3-5개의 간단한 감정 분석 예제만 보여줘도, 예제에 없는 것 까지 예측해서 답을 줄 수 있었습니다.(참고: 그림 2 -오른쪽)
위의 사례 외에도 Hyper CLOVA 스튜디오라는 엔진을 통해 감정 분석기, 이메일 답변 작성기, 제목 생성 등 창작 AI, 언어 간 번역, 사투리 번역, 삼행시 쓰기, 영화 추천, 비속어 제거, 기사 작성, 자기 소개서 작성, 증상 별 진료 과목 추천 등 사용자가 원하는 다양한 인공지능 모델을 만들 수 있습니다.
네이버는 앞으로 한국어 외의 언어로 언어모델을 확장하고 영상·음성·이미지 등을 이해하는 ‘Multimodal AI’로 Hyper CLOVA를 발전시킬 계획이라고 합니다.
Hyper CLOVA와 같은 대규모 언어모델이 더 많은 사람들에게 더 쉽게 사용 될 수 있도록 서비스 된다면, AI 전문가가 아닌 기획자가 아이데이션하고 스스로 결과물까지 만들 수 있어 상상하지 못했던 새로운 서비스들이 많이 나타나지 않을 가 기대해봅니다.
참고 자료: https://tv.naver.com/ainow