[분석지능팀 김무성]
작년 연말 갑작스럽게 등장한 ChatGPT 이후로 GPT-4에 대한 여러 소문이 있었습니다. 그리고 저번 주에 ‘곧 공개될 거야!’라는 뉴스[1]가 나왔을 때도 반신반의했습니다. 물론 ‘지금까지의 OpenAI와 MS의 속도로 보면 정말일지도’라고 기대감도 높았어요. 그런데 실제로 오늘 GPT-4가 공개되었습니다[2]. 어제 있었던 구글의 AI 관련 발표[3]도 대단했는데 그냥 아예 묻혀버렸네요. 심지어 구글과 달리 GPT-4는 부분적으로 써볼 수 있습니다.
루머는 여러 가지였습니다. 멀티모달이다, 크기가 어마어마하게 더 커졌다. 튜링 테스트를 통과했다. 등등. 일단 멀티모달인 것은 맞았습니다. 그리고 여러 가지 벤치마크에서 GPT-3와 비교해서 더 높은 수준을 보여주고 있습니다. 미국의 몇 가지 인간용 시험들에서 인간에 가깝거나 그 이상의 성적을 보이는 결과도 나왔습니다. 자세한 내용은 리포트[4]와 비디오[5], 공식 블로그[2]를 직접 보시기를 추천해 드립니다.
GPT-4의 등장에 대해, 알파고 쇼크에 비견될만한 변화를 가져올 거라고 여러 업계와 연구자들이 기대와 호기심, 어쩌면 불안감을 가지고 바라보고 있습니다. 물론 지금 좀 분위기가 격앙된 경향이 있지만 알파고와 마찬가지로 그 후 여러 AI 연구/산업 생태계가 어떻게 변화했는지 떠올려봅시다. 데이터와 컴퓨팅 연산을 많이 쓰는 것을 당연하게 여기게 되었고, 이를 관리/처리하는 것에 대한 인프라와 인력에 대한 투자를 많이 했습니다.
그러면 GPT-4 이후로는 어떤 일이 일어날 것인가? 일단 GPT-4가 대변하는, 돈 많이 들고 중앙 집중적으로 관리되며 API를 통해 부분적으로만 공개되는 ‘제품이 되어버린 지능’은 점점 그 영향력을 키워갈 가능성이 높습니다. 그래서 이번 GPT-4의 발표에서의 연구자료들은 연구 논문보다는 제품 설명서에 가깝게 보입니다.
그리고 다른 획기적인 방법론이 등장하기 전까지는 거대 모델을 프름프트나 인스트럭션 등을 사용하여 데이터 효율적인 방식으로 다루는 방식이 점점 발전하고 이를 통해 빠르게 제품과 서비스에 통합하는 영역이 커질 것 같습니다.
또한 이와 한편으로는 이에 대응하여 오픈소스로 거대 모델들을 따라가려는 쪽도 계속해서 등장하겠죠. 실제로 ChatGPT 공개 이후로 여러 가지 공식/비공식적으로 오픈소스 버전들이 숨 가쁘게 나오고 있습니다[6].
그리고 전통적인 스몰/미디엄 모델들을 직접 학습시켜가며 부분별 특화 문제들을 푸는 식으로 대응할 수도 있습니다.
즉 1) 최고 성능의 모델들은 점점 공개되지 않을 것입니다. 2) 이 최고 모델들보다 한 세대 정도 느리게 따라가는 오픈소스들이 열심히 등장할 것입니다. 3) 1과 2가 하기엔 너무 협소한 문제들에 대해 보조적으로 작은 모델들을 직접 운영할 수도 있습니다. 물론 3의 경우도 데이터가 충분해야 하기에 모두가 할 수 있는 것은 아닙니다. 셋 다 트레이드 오프가 있기 때문에 이 중 어떤 것을 선택할지 전략적 스위칭이 가능합니다. 다만 AI 엔지니어링 역량이 높고 데이터 거번넌스가 탄탄하게 구축되어 있는 조직이어야 하겠죠.
점점 AI가 현실로 나오고 있습니다. 물론 꼭 이런 형태였을 필연적 이유는 없었을지도 모릅니다. 미래는 다른 방식일 수 있습니다. 그래도 당분간은, 하늘에서 땅으로 뻗어 내린 거대한 파이프라인을 타고 ‘말’의 형태로 현현하여 다양한 화신들로 태어나는 것을 우리는 목격하게 될 것입니다.
(* 이글은 GPT-4로 작성되지 않았습니다)
References
1. https://www.aitimes.com/news/articleView.html?idxno=149895
2. https://openai.com/research/gpt-4
3. https://korea.googleblog.com/2023/03/technologyai-developers-google-cloud-workspace.html
4. https://cdn.openai.com/papers/gpt-4.pdf
5. https://www.youtube.com/watch?v=outcGtbnMuQ
6. https://www.together.xyz/blog/openchatkit
(GPT-4에게 아래와 같이 물어보았습니다)
나 : 저 위의 글에서 다섯 개의 주요 문장 뽑아줘.
GPT-4 :
- GPT-4의 등장은 AI 업계에 큰 파장을 일으키고 있습니다.
- 멀티모달 모델로서, 이전보다 향상된 성능과 높은 표준을 보여주고 있습니다.
- 돈이 많이 들고 중앙 집중적으로 관리되며 API를 통해 부분적으로만 공개되는 ‘제품이 된 지능’의 영향력이 증가할 것입니다.
- 거대 모델에 프롬프트나 인스트럭션 등을 통한 데이터 효율적인 방식으로 빠르게 제품과 서비스에 통합하는 영역이 확장될 것입니다.
- AI 엔지니어링 역량이 높고 데이터 거버넌스가 탄탄한 조직에서 이러한 변화를 전략적으로 스위칭하며 다양한 방식으로 활용할 수 있을 것입니다.
(GPT-4에게 다시 아래와 같이 요청하였습니다)
나: “GPT-4라는 이름의 유령”이라는 제목으로 글 써줘. 요지는 아래와 같아. 번호 붙이지 말고 자연스럽게 써줘. 전부 존댓말로.
- GPT-4의 등장은 AI 업계에 큰 파장을 일으키고 있습니다.
- 멀티모달 모델로서, 이전보다 향상된 성능과 높은 표준을 보여주고 있습니다.
- 돈이 많이 들고 중앙 집중적으로 관리되며 API를 통해 부분적으로만 공개되는 ‘제품이 된 지능’의 영향력이 증가할 것입니다.
- 거대 모델에 프롬프트나 인스트럭션 등을 통한 데이터 효율적인 방식으로 빠르게 제품과 서비스에 통합하는 영역이 확장될 것입니다.
- AI 엔지니어링 역량이 높고 데이터 거버넌스가 탄탄한 조직에서 이러한 변화를 전략적으로 스위칭하며 다양한 방식으로 활용할 수 있을 것입니다.
GPT-4:
요즘 인공지능 업계의 주목받는 주인공은 바로 GPT-4입니다. 전 세계적으로 많은 분들이 이 ‘유령’을 두려워하시거나, 호기심으로 관심을 갖기 시작했습니다. GPT-4는 이전보다 더 강력한 성능을 자랑하는 멀티모달 모델로, AI 업계에서 큰 변화를 불러올 것으로 예상됩니다. 이 글에서는 GPT-4가 미래 AI 업계에 어떤 영향을 미칠지 살펴봅니다.
GPT-4의 등장은 AI 업계에 큰 파장을 일으키고 있습니다. 이전 세대의 모델들과 비교하여 놀라운 성능 향상을 보여주면서, 많은 기업들이 이 모델을 활용한 다양한 서비스를 개발하고자 노력하고 있습니다. 멀티모달 모델로서, 이미지, 텍스트, 음성 등 다양한 데이터 형태를 처리할 수 있는 GPT-4는 이전 세대의 AI 모델보다 더 넓은 영역에서 활용 가능성을 보여주며, 높은 표준을 세우고 있습니다.
그러나 GPT-4의 개발과 유지 비용이 매우 높기 때문에, 중앙 집중적으로 관리되며 API를 통해 부분적으로만 공개됩니다. 이로 인해 자금이 많이 들고 제한적으로 접근 가능한 ‘제품이 된 지능’의 영향력이 증가할 것으로 보입니다.
거대 모델인 GPT-4는 프롬프트나 인스트럭션 등을 통해 데이터를 효율적으로 처리할 수 있습니다. 이를 활용해 기업들은 빠르게 제품과 서비스에 통합하는 영역이 확장되며, 다양한 형태의 가치 창출이 가능해질 것입니다.
GPT-4를 효과적으로 활용하기 위해서는 AI 엔지니어링 역량과 데이터 거버넌스가 탄탄한 조직에서 이러한 변화를 전략적으로 스위칭하며 다양한 방식으로 활용할 수 있어야 합니다. 이를 통해 기업들은 GPT-4의 강력한 성능을 최대한 활용하며, 지속적인 혁신과 시장 선도를 이룰 수 있을 것입니다.