[Media AI서비스팀 이진희]
최근 텍스트 만으로도 실제와 비슷한 동영상을 제작할 수 있는 생성 AI 서비스들이 우후죽순 등장하며 연일 화제에 오르고 있습니다. 2024년 2월, OpenAI에서 발표한 Sora(소라)가 대표적인데요. 실제 카메라로 찍은 듯 리얼한 영상을 생성해내서 많은 사람들에게 충격을 주었었죠.
그리고 5개월이 지난 지금, Sora의 강력한 경쟁자가 될 다양한 생성 AI 기술들이 공개 되었습니다. OpenAI에서도 꽤 긴장하고 있을 것 같은데요. 현실보다 더 현실 같은 영상을 만들어 내는 Text-To-Video 기술들을 지금부터 소개해드리겠습니다.
- Kling.AI (클링 AI) https://kling.kuaishou.com/
중국의 ‘콰이쇼우’라는 기업에서 공개한 비디오 생성 AI 모델입니다. Sora는 대략 1분 길이의 영상을 제작할 수 있는 데에 반해, Kling은 최대 2분 길이, 1080p 해상도의 영상을 생성할 수 있습니다. 게다가, Kling은 복잡한 운동과 실제 세계의 물리적 특성을 효과적으로 시뮬레이션 해서 영상을 생성해냅니다. 이러한 부분 때문에 Kling으로 생성한 영상이 더욱더 사실적으로 보이는건데요. 말이 어려워서 이해가 잘 안 되신다고요? 아래 영상을 보시면 실제 사람이 음식을 먹고 있는 것 처럼 사라지는 모습을 보실 수 있을 겁니다. 바로 이 부분이 물리적 특성을 반영한 부분이라는 것이죠. 봐도봐도 실제처럼 느껴지지 않나요?
Kling은 사용자가 최소한의 노력으로 매력적인 비디오 콘텐츠를 제작할 수 있게 하여, 짧은 비디오 제작의 장벽을 낮추는 것을 목표로 하고 있다고 합니다.
2. Dream Machine (드림 머신) https://lumalabs.ai/dream-machine
Dream Machine은 Luma AI에서 개발한 생성 AI 모델입니다. 이 모델은 다양한 형태의 정보를 한꺼번에 받아들이고 처리해서 풍부한 결과를 만들어낼 수 있도록 ‘멀티모달 트랜스포머 아키텍처’를 기반으로 하고 있는데요. 직접적으로 비디오를 학습해 물리적으로도 정확하고 일관된 장면을 생성해낸다고 합니다. Luma AI는 기존에도 3D 기술에 대해 오랜기간 연구를 진행해오고 있었는데요. 아래의 영상에서 볼 수 있는 것처럼 영상 내에 공간감이 살아있고, 카메라 모션 등의 특징이 더해져 더욱 현실적으로 보이는 것 같습니다.
현재 Dream Machine 사이트에 접속하면 하루에 3개까지 무료로 비디오를 생성해 낼 수 있다고 하니 직접 사용해보셔도 좋을 것 같네요.
3. Gen-3 Alpha (젠-3 알파) https://runwayml.com/blog/introducing-gen-3-alpha/
Runway의 Gen-3 Alpha는 최근에 출시한 생성 AI모델로, 이전 버전인 Gen-2에 비해 세부 사항, 일관성, 그리고 움직임 표현 등이 크게 향상 되었습니다. Gen-2와 Gen-3 Alpha의 결과물을 비교한 내용은 아래의 영상을 통해 확인하실 수 있고요. 이 모델은 장면마다의 요소와 장면 전환을 세밀하게 제어 할 수 있는 능력이 있고, 영화적 용어를 해석할 수 있도록 설계되어 있어 마치 영화처럼 보이는 영상을 생성할 수 있습니다. 또한 다양한 동작과 모션, 감정을 표현할 수 있는 현실적인 캐릭터의 생성이 가능해 콘텐츠 제작에도 도움이 될 것으로 보이고요.
Gen-3 Alpha 모델은 현재 공개 되어, 일정 비용을 지불하면 사용이 가능합니다.
Conclusion
얼마 전, 글로벌 완구 업체인 ‘토이저러스’에서 Sora를 활용한 상업용 광고를 선보였습니다. 물론영상 편집 프로그램으로 다듬는 과정이 필요하긴 했지만 콘티부터 최종 완성까지 몇 주 만에 제작을 끝냈다고 하죠. 이러한 다양한 생성 AI 기술의 등장으로 사용자들의 접근성이 용이해짐에 따라 이러한 AI 기술을 활용한 국내외 영화제도 개최되고 있고요. 모든 사람들이 AI의 발전을 두려워하던 시기를 넘어, 함께 살아가는 방법과 즐기는 방법을 찾아내고 있는 요즘입니다.