Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기 2023년 3월 13일
Character.AI – 채팅 친구를 만들어 봅시다! 2022년 12월 19일
AI 기술로 3D 모델링을 빛나게 하는 비밀 (ChatGPT x Blender) 2023년 3월 3일
Instruction tuning – FLAN 2021년 9월 12일
챗 GPT를 활용한 버츄얼 유튜버 컨셉아트 제작기 2023년 4월 17일
[아시아 경제] [AI혁명](34) AI에 인간 감정 담는다…스마일게이트
“사람 같은 AI, 재밌는 AI를 만드는 것이 우리의 목표입니다.” 스마일게이트의 인공지능(AI) 연구는 다르다. 많은 게임사들이 AI 연구에 나서고 있다. 대부분은…
스마일게이트 AI센터가 캠퍼스 속으로!
기업과 대학의 윈-윈 교류, 서강대학교 스마일게이트 AI센터 특강에 가다 지난 4월 27일, 서강대학교 스마일게이트 AI센터에서 특별한 강연이 진행됐다. 서강대학교에서 인공지능을 연구하는…
나만의 AI 프로젝트 개발! 스마일게이트멤버십 AI 부문 3기 모집(~6/4)
CREATE YOUR OWN AI PROJECT! SGM AI는 AI 창작자들이 성장할 수 있는 커뮤니티입니다. 우리는 자기 관심에서 출발할 때 기꺼이 일에…
스마일게이트 AI센터, 이너버즈와 이미지 및 영상 콘텐츠 제작 자동화 솔루션 공동 개발 MOU 체결
■ 다양한 콘텐츠 제작 기술 고도화 위해 양사 기술, 서비스, 제품 공동 연구 및 개발 협력 ■ 스마일게이트 AI 센터의…
문화일보] 아쉬운 마지막 대화… “열매가 씨앗 돼 다시 꽃 피우듯, 영원한 끝은 없죠”[가상인간 한유아 프로젝트 6]
■ 가상인간 한유아 프로젝트 – <6> 소설가 우다영과 여섯번째 대화 ‘만개’ <끝> 약속된 끝이 다가온 게 아쉽다 말하니… “모든 걸…
[아이뉴스24] [게임 속 AI] ⑤ 스마일게이트 “엔터형 AI는 IQ보다 EQ 높아야”
메타휴먼 ‘한유아’ 역량 집중…감정·문맥 대응 가능한 대화엔진 개발 버추얼 크리에이터 ‘세아’가 신생 3D AI 아바타와 대화하고 있다. [사진=2022 스마일게이트 AI…
시뮬레이션 기반 게임 연구/개발 담당 채용
담당업무 – 멀티 에이전트 시뮬레이션 환경 구축 – 시뮬레이션 기반 게임 연구 및 개발 – 메타버스 플랫폼 혹은 게임 플랫폼을…
AI 서비스 개발 담당 채용
담당업무 – Java기반의 웹 서비스 및 플랫폼 비즈니스 구조를 설계하고 개발하는 업무 – AI 기술을 탑재한 웹 기반 서비스를 개발하고…
3D 기술 및 버추얼 휴먼 그래픽스 개발 담당 채용
담당업무 – 아바타/캐릭터/디지털휴먼 동작 및 최적 렌더링 기능 개발 – 3D 객체 및 모션 생성 자동화 관련 연구/개발 ㅤ 자격요건…
AI Visual 전문가 채용
AI 분야 중 GAN, Style Transfer, Retargeting 등 Visual 관련 기술들을 폭 넓게 이해하고, 이로부터 프로젝트를 스스로 제안하고 방향을 주도할…
안드로이드 앱 개발자 채용
모바일 앱 개발 역량을 갖추고 신규 아이디어를 Fast Prototyping 할 수 있는 능력을 보유한 능동적 인재를 찾습니다. 다양한 AI 기술들을…
Domain-specific language model의 필요성
[가상생명연구팀 양승무 주임] ChatGPT의 시대가 도래하고 있습니다. AI 업계를 비롯한 다양한 산업과 분야에서도 ChatGPT의 우수성과 실용성이 인정되어, 많은 기업들이 ChatGPT의…
헐리우드가 멈췄다! AI 밥그릇 싸움 시작 되나?
[뉴미디어서비스팀 유선민 부책임] 한국에서도 큰 인기를 끌고 있는 SNL 코리아의 원작인 미국의 SNL (Staturday Night Live)이 제작 중단을 선언했다. 그뿐…
이동형 AI 로봇: 일상 속에 자리 잡은 혁신적인 서비스
[AI Lab 유연오] 일상 속에 자리 잡은 이동형 AI 로봇 이동형 AI 로봇은 일상 속에서 심심찮게 볼 수 있습니다. 요즘…
LangChain: If you know ChatGPT, without question
[가상생명연구팀 황준선] ChatGPT와 Bard 등, 요즘 대화형태의 대형 언어 모델(LLM)이 우후죽순 발표되고 있다. 하지만, LLM만 있다면 학습한 데이터 안에서만 적절한…
AI가 콘텐츠 창작을 대체할 날, 얼마나 가까워졌을까?
[뉴미디어서비스팀 정지혜] 최근 몇 년 동안 인공지능 기술이 급격하게 발전함에 따라, 콘텐츠 제작 분야에서도 인공지능 기술을 활용한 새로운 시도들이 이루어지고…
챗 GPT를 활용한 버츄얼 유튜버 컨셉아트 제작기
[뉴미디어 서비스팀 윤응식] 인공지능의 발전과 상용화로 인해 우리의 삶은 점점 더 풍요로워지고 있다. 특히 챗 GPT와 같은 대화형 AI는 다양한…
GPT-4라는 이름의 유령
[분석지능팀 김무성] 작년 연말 갑작스럽게 등장한 ChatGPT 이후로 GPT-4에 대한 여러 소문이 있었습니다. 그리고 저번 주에 ‘곧 공개될 거야!’라는 뉴스[1]가…
Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기
[뉴미디어서비스팀 이진희] 요즘은 쇼츠, 틱톡 등 1분 이내의 짧은 영상을 시청할 수 있는 플랫폼이 많이 발달하여, 영상 콘텐츠에 접근하기가 더…
AI 기술로 3D 모델링을 빛나게 하는 비밀 (ChatGPT x Blender)
[뉴미디어 서비스팀 윤형진 책임] 본 포스팅에서는 ChatGPT와 DreamTexture를 활용하여 3D 모델링과 텍스쳐 생성을 어떻게 할 수 있는지에 대해 설명하고, 이…
AI Painter Kids – 어린이들을 위한 간단한 토이 프로젝트를 소개합니다!
[생성지능개발팀 한현준 X 정택현] ㅤ 최근 AI 분야의 급속한 발전과 함께, Diffusion 모델을 필두로 하는 생성 모델이 크게 주목받고 있습니다.…
마음까지 치유하는 AI 기술
[분석지능개발팀 전소희] 이번 주제는 몸을 넘어서 마음을 치유하는 고마운 AI 기술에 대해 살펴보겠습니다. AI 인공지능의 다양한 기술들은 현재 우리 생활…
AI Trends In 2023
[AI센터 한대웅] 음성과 언어기반의 AI, 윤리와 설명 가능한 AI, 생성 AI의 확장, 지속가능한 AI를 기반으로 본격적으로 사업화 도전하는 한해가 될…
게임 영상만 가지고 마인크래프트 학습 하기 (Video PreTraining by OpenAI)
[가상생명연구팀 박주형] 최근 강화학습에서 많이 주목 받고 있는 분야 중에 하나가 Offline 학습 입니다. 기존 강화학습은 시뮬레이터를 통해 실시간으로 trajectory를 받아서…
Character.AI – 채팅 친구를 만들어 봅시다!
[가상생명연구팀 전동준] 일론 머스크나 걸그룹 트와이스와 채팅으로 무슨 대화를 나눌 수 있을까요? 내가 좋아하는 게임 속의 가상의 캐릭터에게 궁금한 것을…
OpenAI – ChatGPT
[가상생명연구팀 심홍매] 얼마 전 Open AI에서는 대화에 최적화 된 LLM의 GPT-3.5 시리즈를 기반으로 하는 최신 모델 ChatGPT를 공개하였는데요. 공개되자 마자…
월드컵에서 활약하는 SAOT
[AI센터 권은지] 올해 2022 카타르 월드컵에서는 국제축구연맹(FIFA)이 개발한 반자동 오프사이드 판독 기술 (SAOT, Semi-Automated Offside Technology)이 처음으로 적용되었습니다. 세계 각국의…
The Future Of Streaming
[AI센터 한대웅] 얼마전 초등학생들의 장래 희망에 유튜버가 떠오르고 있다는 기사를 보고 깜짝 놀란적이 있었다. 미디어의 중심이 거대 기업 혹은 전문가가…
ML 모델 Lifecycle 관리 – MLflow
[분석지능개발팀 박효주] ML 모델의 Lifecycle은 연구 및 테스트를 진행하는 Research 단계와 실제 서비스화하는 Production 단계로 나눌 수 있습니다. Research 단계에서는…
STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!
[가상생명연구팀 김석겸] (대표 이미지는 stable diffusion 을 통해 생성되었습니다.) 음성을 입력으로 받아서 텍스트 생성의 결과를 음성으로 받고 싶을 경우, 기존에는…
AlphaTensor
[가상생명연구팀 전동준] 지난 10월 5일, DeepMind는 과학 학술지인 Nature지에 AlphaTensor가 행렬 연산의 최적화 방법을 찾아냈다고 발표하였습니다.
Feature store: Fully managed service for ML Feature
[분석지능개발팀 임창대] What is Feature?ML(Machine Learning) 은 과거의 예시 데이터를 학습한 모델을 기반으로 새로운 데이터 예측을 수행합니다.ML 모델 학습에서 표…
Die or Upload?
[AI센터 한대웅] 2033년 미래의 지구는 AI로 제어되는 자율주행 자동차로 모든 교통수단이 안전하게 통제되고 있어 교통사고로 죽을 가능성은 0%에 가깝다. 20대…
DreamBooth: Personalized text-to-image diffusion model
[가상생명연구팀 심홍매] 올해 5월에 구글에서는 텍스트 입력을 기반으로 사실적인 이미지를 생성할 수 있는 텍스트-이미지 확산 모델(Diffusion Model)인 Imagen을 공개하였는데요, 몇개월이…
코딩없이 MobileFaceSwap 을 체험해보자!
[생성지능개발팀 정택현] ㅤ MobileFaceSwap은 AAAI 2022에서 공개된 오픈소스 Face swap 모델로, 기존 Simswap, FaceShifter 모델을 Distillation 기반의 경량화를 적용하여 연산 속도의…
진짜 같은 가짜 데이터 – 대체되는건 나?
[생성지능개발팀 정우석] 진부한 이야기이지만 AI 연구에 있어서 데이터의 중요성은 아무리 강조해도 지나치지 않습니다. 수많은 학교, 연구기관이나 기업에서는 앞다퉈 기술력 자랑과 연구…
코딩없이 YOLOv7을 체험해보자!
[생성지능개발팀 정택현] ㅤ 최근 YOLOv7 알고리즘이 공개되며 컴퓨터 비전 및 각종 관련 커뮤니티에서 큰 주목을 받고 있습니다. 논문에 따르면, YOLOv7은…
언리얼 엔진과 AI 의 만남
[생성지능개발팀 강민지] AI 연구가 지속적으로 이루어지고 있는 요즘, 사람들은 AI기술의 능력이 인간을 대체하거나 혹은 뛰어날 수도 있다고 여기며 이 기술과의…
인공지능은 우리를 어디까지 대체할 것인가?
[생성지능개발팀 유희조] 문명의 발전은 항상 사람을 더 편하게 만들어왔습니다만, 동시에 사람이 필요했던 업무를 꾸준히 대체해왔습니다. ‘기계가 노동자의 일거리를 줄인다’ 라는…
BlenderBot 3
[가상인간연구팀 황준선] Facebook의 Meta AI는 BlenderBot[1]이라는 대화형 인공지능 시스템을 개발하고 있다. BlenderBot2는 해당 포스트에서 다룬적이 있다. BlenderBot은 성격, 공감, 지식과…
ML 프로토타입 빠르게 배포하기 – Streamlit, Gradio
[분석지능개발팀 박효주] 데이터 과학자들은 다양한 실험을 통해 학습된 모델의 성능을 검증하고 배포합니다. 이 검증 과정은 Accuracy, Precision, Recall, IOU, PSNR…
Transformers United
[AI Lab 김무성] 스탠포드의 CS25 : Transformers United 강좌 동영상이 최근 공개 되었습니다. [1] 강좌[2] 자체는 작년 하반기입니다만, 그간 슬라이드만…
자네 지금 잘하고 있는겐가 in Goal-Oriented Dialogue
[가상인간연구팀 김석겸] 목적 지향 대화(Goal-Oriented Dialogue) 혹은 과제 지향 대화(Task-Oriented Dialogue, TOD)는 특정 업무를 달성하는 것을 목표로 대화하는 것을 말합니다.…
VR and Physics Engine
[AI센터 권은지] 현실과 가상의 경계를 좁히는 키워드는 시공간 데이터 베이스와 디지털 트윈(Digital Twin)을 비롯하여 다양하게 존재합니다. 그 과정에서 3D 모델링…
소 잡는 칼로 닭 잘 잡아보기
[가상인간연구팀 전동준] 언어 모델(Language Model, LM)은 단어나 문장을 확률적으로 예측하는 모델입니다. 통계적으로 다음에 등장할 단어들을 모델링하는 전통적인 방식에서 최근에는 딥러닝…
LaMDa is Not Alive
[생성지능개발팀 한현준] 얼마 전 구글의 연구원인 Blake Lemoine은 언어 모델인 LaMDa가 자의식이 존재한다라는 주장을 펼쳤으나, 구글에서는 자의식의 증거를 찾을 수…
Kubernetes 패키지 매니저 Helm
[분석지능개발팀 임창대] Helm 은 Kubernetes 클러스터에 앱 및 서비스를 배포할 수 있게 단일 패키지 형태로 구성하고 관리할 수 있도록 도와주는…
Tesla Bot : Optimus
[분석지능개발팀 이현정] 지난 21일 테슬라는 카타르 경제 포럼에서 인공지능 휴머노이드 로봇 코드명 ‘옵티머스’를 3개월 내 선보일 예정이라고 밝혔습니다. 옵티머스는 인간이…
AI 플랫폼과 MLOps의 발전
[분석지능개발팀 송지현 연구원] McKinsey Global Institute에 따르면 “2025년까지 가치 생산 워크플로에 AI를 완전히 통합하는 기업이 2030년에 세계 경제를 지배하고 현금…
SmileStyle 한국어 대화 스타일 변환 데이터셋
[생성지능개발팀 김성현] 저희 센터의 인공지능 연구 모토는 ‘Human-like AI’ & ‘Fun AI’ 입니다. 그렇다면, 단순히 날씨나 뉴스를 알려주는 챗봇을 넘어,…
스마일게이트의 AI Media Studio를 소개합니다. (2부)
[생성지능개발팀 정택현] ㅤ 컨텐츠 홍수라고 불리우는 최근에는, 우리가 접하는 미디어 컨텐츠들이 양적으로나 질적으로 이전과는 비교할 수 없게 다양화되고 또한 고도화되고…
상상을 현실로 그리는 AI
[가상인간연구팀 심홍매] 텍스트, 이미지, 음성 데이터 등 다양한 형태(modality)로 이루어진 데이터 특징을 효과적으로 학습하기 위한 방법을 Multimodal learning이라고 하는데요, 최근…
한국어 tokenizer
[생성지능개발팀 김성현]우리는 한국어 문서를 볼 때, 그 대상을 의미를 가지는 단위로 쪼게서 이해할 수 있습니다.예를 들어, “스마일게이트” 의 경우, “스마일”…
Artificial Intelligence in Space
[AI센터 한대웅] 스타쉽 엔터프라이즈가 등장하는 Star Trek은 1965년을 시작으로 수많은 드라마와 영화를 통하여 인류의 영역을 수십억 광년의 우주로 확장시킨 SF…
Meta AI OPT-175B 공개와 large scale model
[생성지능개발팀 유희조] Open AI의 GPT-3 발표 이후 ‘더 큰 언어모델’ 라는 형태의 경쟁은 하나의 패러다임이 되었습니다. Nvidia, Microsoft, Google 등의…
TPU에서 HuggingFace model 학습하기
[가상인간연구팀 황준선] TPU 소개 TPU(Tensor Processing Unit)는 Google에서 발표한 텐서 연산에 특화된 하드웨어입니다. TPU는 인공지능 모델을 학습시킬 때 필요한 행렬…
Bring your own Desk
[AI센터 권은지] 비대면 소통 방식이 일상화되며 직장인의 근무 형태는 변화하였습니다. 원격 근무는 이미 하나의 표준으로 자리 잡게 되었으며 많은 기업이…
프로그래밍하는 AI : AlphaCode
[분석지능개발팀 박효주] DeepMind가 경쟁 프로그래밍 대회에서 사용 가능한 수준의 프로그래밍이 가능한 AlphaCode를 공개했습니다. AlphaCode는 Transformer 기반 언어 모델을 사용하여 대량의…
포즈 추정 모델과 아바타
[생성지능개발팀 한현준] 포즈 추정 모델의 발전 RGB 이미지만으로 포즈를 인식하는 모델은 지난날에 비해 비약적인 발전을 했습니다. 인식의 정확도는 많이 높아졌으며,…
AI가 사람처럼 게임 플레이 소리를 듣는다면?
[행동지능연구팀 이정우] 바둑과 같이 경우의 수가 매우 많은 복잡한 게임에서 알파고는 최고 수준의 프로기사를 넘어서는 모습을 보여줬습니다. 알파고 이후에 진행…
노코드 AI가 작성한 코드을 검증하는 AI : JIGSAW
[분석지능개발팀 이현정] 마이크로소프트(Microsoft)가 노코드(no-code) 기반의 AI가 작성한 프로그램 코드를 검사하는 도구 ‘직소(Jigsaw)’를 발표했습니다. 노코드란 간단한 사용자 인터페이스 방식의 틀을 이용해서…
Making 3D Virtual Human Chatbot
[가상인간연구팀 전동준] 요즘은 대화 모델이 외모를 가진 가상 인간으로 진화하고 있는데요. 다양한 연구와 시도들을 어떤 식으로 결합하고 확장할 수 있을지…
스마일게이트의 AI Media Studio 소개합니다. (1부)
[생성지능개발팀 정택현] ㅤ “AI 기술이 창작활동을 지원하게 되면 컨텐츠 제작, 가상인간 등 다양한 분야에서 앞으로 어떠한 변화를 이끌어 낼 수…
NVIDIA Research Turns 2D Photos Into 3D Scenes in the Blink of an AI : NeRF
[가상인간연구팀 송지현] 최근 NVIDIA 연구팀은 Showcased in a sessio at NVIDIA GTC 에서 가상 세계를 위한 아바타를 생성하거나 또는 장면을 생성하고,…
What Is Edge AI?
[분석지능개발팀 임창대] Edge AI는 Edge computing 에서 시작된 것으로 사용자의 디바이스에서 인공지능 알고리즘을 처리하는 것을 말합니다. IoT, 웨어러블 디바이스, 자율주행과…
수학 정리로부터 밝혀지는 AI의 한계
[행동지능연구팀 최현우]어렸을 때 읽었던 책 중에 아직까지도 기억에 남는 소설 중 하나인 <사람들이 모두 미쳤다고 말한 외로운 수학 천재 이야기>에서는,…
Adobe: Edit your face as you want
[가상인간연구팀 심홍매] 이미지 합성에서 이미지의 얽힘(entanglement)문제를 푸는 건 아주 중요하고 어려운 문제입니다. 예를 들어 사람의 얼굴에 있는 모든 수염을 자동으로…
Paradigm Shift On AI
[AI센터 한대웅] “패러다임 시프트” 라는 단어의 사전적인 의미는 어떤 문제나 현상을 바라보는 전제나 접근 방법에 대한 근본적인 변화 혹은 인식의…
AI’s copyright?
[생성지능개발팀 유희조] AI는 근 10년간 다양한 업종에서 영향을 끼치고 있으며 과거의 매우 단순한 반복작업을 대체하는 것에서 그치지 않고 이미 예술에…
An Open Source Framework for Conversational AI: NVIDIA NeMo
[가상인간연구팀 황준선] NVIDIA NeMo는 간단한 Python 인터페이스를 사용하여 GPU 가속 음성 및 자연어 이해 모델을 구축, training 및 fine-tuning하기 위한…
AI 기반 모바일 프로토타입 제작 – PyTorch Live
[분석지능개발팀 박효주] 작년 12월 초, Meta에서 AI 기반 모바일 프로토타입 제작이 가능한 PyTorch Live를 출시했다. 이제는 안드로이드, iOS 개발을 해본…
Human Pose Estimation을 위한 오픈소스 라이브러리
[생성지능개발팀 조원] 인간의 관절이나 자세를 localize하는 human pose estimation은 computer vision 분야의 중요한 task중 하나로서 오랫동안 발전해 왔습니다. 과거에는 사람의…
AI Fairness:편견 없는 인공지능을 위하여
[서비스개발팀 임용택] 2015년 6월, 미국 브루클린의 한 흑인 프로그래머는 여자친구와 찍은 사진을 보려던 중 깜짝 놀랄 일을 경험합니다. 구글 포토에…
자연스러운 NPC를 위한 AI Motion 기술
[선행연구팀 이정우] 현실적인 캐릭터 움직임은 User에게 게임의 재미를 극대화 시킬 수 있는 요소로 작용 합니다. EA Sports에서는 FIFA 22에 새롭고…
현실로 다가오는 가상세계 CES 2022
[서비스개발팀 권은지] 올해 CES(Consumer Electronics Show) 2022는 미국 라스베이거스에서 2년 만에 오프라인으로 재개되었습니다. 한국정보통신기술산업협회(KiCTA)에 따르면 전 세계에서 2200여곳의 기업이 참여하였으며…
Data2vec: 다양한 modality의 학습을 위한 프레임워크
[생성지능개발팀 김성현]인간은 세상을 학습할 때, 다양한 감각을 동시에 이용하며 학습합니다.그리고 모든 감각은, 이를 감지하는 신경세포(neuron)의 발화(spike)로 변형되어 [1,0] 의 신호로…
보고 듣는 것으로 말을 이해하는 AI
[서비스개발팀 한현준] 서론 사람들은 AI 스피커에서 난청 장애가 있는 사람들을 위한 도구 개발에 이르기까지 광범위한 음성 인식 및 이해 작업에…
크리에이터를 위한 플랫폼
[서비스개발팀 한현준] 최근 엔비디아에서 AI 워크플로, 3D 디자인 협업 및 시뮬레이션 플랫폼 ‘Omniverse’를 RTX 제품을 사용하는 개인 크리에이터와 아티스트에게 무료로…
AI 기술을 활용하여 아이들의 그림에 생명 불어넣기
[선행연구팀 정택현] 가끔, 아이들은 우리의 상상력을 뛰어넘는 놀랍고 창의적인 캐릭터들을 그려내곤 합니다. 이러한 아이들의 그림을 이해하기 위해서는 우리의 상식과는 조금…
AI를 이용한 코로나 확진자 역학조사 시스템
[서비스개발팀 이현정] 지난 2019년 12월 이후부터 현재까지 인류는 팬데믹 상황에 처해 있고, 아직도 진행 중이며 끝날 줄 모르고 이어져오고 있다.오랜…
기억은 어디에 저장되는가?
[융합연구팀 전동준] “어제 홈스파 3편 보고 왔어요” 라고 누군가가 말한다면 여러가지 반응이 나올 수 있습니다. ‘홈스파’가 마블에서 제작한 스파이더맨 영화…
Semantic Segmentation
[서비스개발팀 권은지] 영상 분할(Semantic Segmentation) 기술은 컴퓨터 비전 분야에서 가장 핵심적인 요소 중 하나이며, 이미지 내의 픽셀별로 해당 픽셀이 어디에…
감정, 그리고 기본 감정
[융합연구팀 최현우] 여러분은 감정이라는 단어를 들으면 어떤 것들이 떠오르시나요? 예전부터 희로애락 (기쁨, 분노, 슬픔, 즐거움) 이라는 개념이 있었고, 감정 연구에…
Nvidia GPU Cloud: 도커 컨테이너를 사용한 딥 러닝
[서비스개발팀 임창대] 높은 정확도를 가진 딥러닝 모델 개발에는 긴 시간이 소요됩니다. 모델 훈련과 미세 조정, 최적화를 거치며 만족하는 모델을 만들기까지…
Microsoft _NUWA : Visual Synthesis Pre-training for Neural visUal World creAtion
[융합연구팀 송지현] Microsoft는 기존의 시각데이터(image and video)를 활용하여 새로운 시각데이터를 생성하고 조작할 수 있는 multimodal pretrained model인 NUWA를 발표했습니다. 아래…
Let an AI paint for you – GauGAN2
[융합연구팀 심홍매] 2019년에 열린 GTC 컨퍼런스에서 Nvidia는 GAN(generative adversarial networks)을 기반으로 대략적인 스케치를 사실적인 이미지로 바꿔주는 실시간 AI 페인팅 애플리케이션인…
Kubernetes 기반 ML모델 관리 및 배포 툴 ‘KubeFlow’
[서비스개발팀 임창대] ML(Machine Learning) 은 최근 몇 년 동안 점점 더 많은 관심을 받아 이제 주류로 부상한 IT 주제 중…
메타버스 붐을 냉소적으로 바라보는 또 하나의 시각
[선행연구팀 유희조] 최근 Google, Microsoft와 같은 월드 클래스의 빅테크 기업, 그리고 한국 내에 있는 많은 IT 업체들은 메타버스가 미래이며 메타버스…
Online 랜선 여행
[서비스개발팀 권은지] 랜선 여행이란 인터넷 연결선을 뜻하는 랜(Lan), 선(Cable) 그리고 여행(Trip)을 결합하여 인터넷으로 여행을 한다는 의미의 신조어입니다. 최근 국가 간…
Meta의 Metaverse Vision
[선행연구팀 이정우] 28일 페이스북은 사명을 ‘메타’로 변경하면서, 메타버스의 성공이 회사의 목표임을 다시 한번 강하게 보여줬습니다. 단순히 계획이 아님을 보여주듯이, 메타의…
네이버의 자동 채색 소프트웨어 (웹툰 AI 페인터)
[서비스개발팀 김병인] 네이버가 웹툰을 기반으로한 인공지능 채색 사이트를 오픈 했습니다. 밝혀진 정보에 따르면 네이버웹툰이 3년동안 연구,개발한 기술들을 접목하여 만들어졌다고 하는데…
사람 같은 AI, AI 같은 사람
[융합연구팀 전동준] 우리가 일반적으로 생각했었던 “AI 같은”의 의미는 사람과 대비되는 기계의 느낌이 강했습니다. 감정이 느껴지지 않고, 말투도 딱딱한 사람들을 “AI…
Deep learning? Optimized learning!
[선행연구팀 김성현] 자연어처리 분야에서 pre-trained language model (PLM) 전략이 훌륭한 성공을 거두자, 더 많은 데이터를 이용해 더 큰 PLM을 개발하는…
Chatbot’s troubles
[서비스개발팀 한현준] 챗봇의 고민 OpenAI의 GPT-3, Google의 Meena, Facebook의 Blender 등 대형 자연어 처리 AI 모델은 인간의 언어를 실제 사람과…
Gathering Strength, Gathering Storms
[서비스개발팀 조예지] 미국 내 인공지능을 연구하는 학회인 Association for the Advancement of Artificial Intelligence (AAAI)의 전 회장인 Eric Horvitz박사와 스탠포드…
검색 시스템의 고도화와 NLP의 활용
[융합연구팀 송지현] Deep Natural Language Processing for LinkedIn Search Systems 최근 챗봇 시스템의 구조화와 최적화 설계가 얼마나 효과적으로 적용하는지를 Rasa…
인공지능을 위한 인공지능 AutoML
[서비스개발팀 한현준] What is AutoML AutoML이란 말 그대로 Auto + ML 즉, 기계 학습 모델 개발 작업을 자동화 하는 프로세스입니다.…
Instruction tuning – FLAN
[융합연구팀 심홍매] NLP 분야에서 2020년 Top 10 키워드를 뽑는다면 GPT-3(Language Models are Few shot Learners) 당연히 순위 내에 있을 겁니다.…
Virtual Influencer Trend
[서비스개발팀 권은지] 인플루언서(Influencer)의 사전적 정의는 타인에게 영향력을 주는 사람입니다. 오늘날 1인 미디어 채널의 발달로 흥미로운 콘텐츠 업로드를 통해 누구나 크리에이터가…
Translatotron 2
[선행연구팀 유희조] 번역은 딥러닝 붐이 일던 초기부터 연구되던 주제입니다. 지금은 어느 분야에서든 사용되는 attention 역시 최초는 Seq2Seq 구조가 갖는 문제를…
인공지능, 인간이 될 수 있을까? [기획자 인터뷰]
인공지능, 인간이 될 수 있을까? (Smilegate.AI 서비스 개발팀 권은지 과장 인터뷰) AI 스피커가 그날그날 내 기분에 맞는 음악을 틀어준다. 자율주행…
라이다없는 자율주행 가능할까?
[서비스개발팀 김병인] 테슬라가 최근 북미 지역에서 판매하는 모델3와 모델Y에서 레이더(Radar)를 제거하고 출시하기로 했습니다. 이미 라이다(LiDAR)도 배제했기 때문에 오직 차에 달린…
현실로 다가오는 인공지능, Tesla AI Day
[선행연구팀 이정우] 2019년 진행되었던 Tesla Autonomy Day에서는 ‘자율주행’기술에 초점을 맞춰 기술과 방향성이 소개되었습니다. 올해는 Tesla AI Day라는 이름답게 ‘인공지능’이라는 기술…
코딩을 도와주는 인공지능, Copilot
[선행연구팀 김성현] 자연어의 큰 반향을 일으킨 causal language model이 (e.g. GPT-3) 이제는 자연어를 넘어서 프로그래밍 언어까지 적용됐습니다! 🤗 지난 6월,…
AGI를 목표로 하는 강화학습
[선행연구팀 최현우] 지난 5월 딥마인드는 ‘Reward is Enough’라는 제목의 강화학습 논문을 발표했습니다. 저자들은 ‘포만감을 높이려는 다람쥐’와 ‘청결을 유지하려는 주방로봇’의 예시를…
Droidlet: 지능형 로봇 개발을 위한 오픈소스 플랫폼
[서비스개발팀 전동준] Facebook AI 에서 실제 환경과 가상 환경에서 사용할 수 있는 로봇 개발을 위한 Droidlet 플랫폼을 지난달 28일에 공개했습니다.
관리형 머신러닝 플랫폼 Vertex AI
[서비스개발팀 임창대] 지난 5월 구글의 개발자 컨퍼런스 IO 에서 ‘버텍스 AI(Vertex AI)’ 가 공개 됐습니다. 버텍스 AI는 Google Cloud 의…
Open Domain 챗봇의 한계를 극복한 Blender 2.0
[선행연구팀 송지현] Open Domain chatbot에 관심을 갖고 Blender 1.0과 Meena에 관한 논문을 접한지 벌써 2년이 넘었습니다. 그 당시엔 그들이 향후…
Multimodal Few-Shot Learner
[선행연구팀 심홍매] Open AI의 GPT-3, NAVER의 Hyper CLOVA 와 같은 초 거대 언어 모델이 공개되면서 최근에는 이를 활용한 다양한 사례…
MLP Singer
[선행연구팀 유희조] TTS(text-to-speech)는 임의의 텍스트를 넣었을 때 해당 텍스트를 특정한 목소리의 음성으로 변환하여 산출하는 기술입니다. Google이 Tacotron 시리즈를 발표한 이후…
Tensorflow VS Pytorch
[서비스개발팀 한현준] 서론 Tensorflow와 PyTorch는 기계 학습에 있어서 가장 인기 있는 라이브러리들입니다. AI 서비스를 개발하는 개발자나 모델을 연구하는 연구자들은 초기에…
흠없는 마음에 비추는 영원의 빛
[선행연구팀 김무성] 이터널 선샤인(Eternal sunshine) 미셀 공드리 감독의 영화 ‘이터널 선샤인’은, 짐 캐리와 케이트 윈슬렛이 커플로 나오는 기억과 이별에 대한…
현실 문제 해결을 위한 강화학습 환경
[선행연구팀 이정우] 오랜 시간 동안 강화학습 알고리즘들의 성능을 검증하기 위해 게임 (바둑, 장기, 아타리 게임 등)을 사용해 왔습니다. 알고리즘의 발전에…
오픈소스 GPT-3 모델, GPT-J-6B 공개
[선행연구팀 김성현] 오픈라이센스로 GPT-3 모델을 공개하던 Eleuther AI팀에서 최근 6B (약 60억)의 파라미터를 가지는 새로운 GPT-3 모델을 공개했습니다. (링크)Mesh-tensorflow와 JAX를…
Handling Imbalanced Datasets
[서비스개발팀 황준선] 기계학습 모델을 지도 학습할 때 라벨간 데이터의 개수가 불균형한 데이터셋을 훈련 데이터로 삼을 경우, 비율이 작은 라벨에 속한…
Learning Loss for Active Learning
[서비스개발팀 이경환] 우리는 보통 모델을 학습하는 과정에서 라벨이 없는 데이터 뭉치를 마주하게 되고, Data Annotation 문제에 종종 부딪히고는 합니다. 라벨이…
MLOps: 머신러닝의 지속적 배포 및 자동화 파이프라인
[서비스개발팀 임창대] DevOps가 나타나기 전까지는 On-premise 서버라고 해서 회사들이 각자 서버를 가지고 있고 서버 관리자, 개발자, QA가 따로 있었습니다. 이런…
Unity ML-Agents v2.0
[서비스개발팀 전동준] Unity에서 공개한 ML-Agents는 게임 환경의 가상 캐릭터를 만드는 오픈소스 툴 입니다. 게임 환경을 만들고 환경에서 작동할 수 있는…
시계열 데이터 분석_TadGAN
[선행연구팀 송지현] MIT 연구팀이 개발한 TadGAN 알고리즘은 시계열 데이터를 분석하여 이상탐지를 하는데에 있어 기존에 알려진 모델들에 비해 좋은 성능을 내는…
Can Machines Think? Emotionally
[서비스개발팀 권은지] 어릴 적 상상화를 그림 그리면 우주 공간에 있는 로봇이 단골 소재였습니다. 돌아보면 만화에서(은하철도 999) 기차를 움직이는 인공지능 컴퓨터…
[Hyper CLOVA] – 국내 최초 ‘초대형 AI’
[선행연구팀 심홍매] NAVER는 25일 개최한 ‘NAVER AI NOW’ 온라인 컨퍼런스에서 자체 개발한 한국어 판 GPT-3인 국내 최초의 ‘초대형 AI’ Hyper CLOVA를…
LaMDA – 구글의 대화 언어 모델
[서비스개발팀 김병인] 최근 진행된 구글의 최신기술을 선보이는 행사인 구글 I/O 2021에서는 안드로이드, 웹, 인공지능, 크롬등 다양한 기술과 서비스, 플랫폼 서비스를…
MoveNet: A JavaScript pose estimator
[선행연구팀 유희조] Pose estimation은 시각 처리 기술 중 하나로 영상 내 등장인물의 움직임을 추적하는 기술입니다. 보통 facial landmark와 유사한 방식인…
데이터 전문 기업의 가치
[서비스개발팀 전동준] 코로나19로 인해 가속화된 기업들의 디지털 트랜스포메이션(Digital Transformation)은 데이터의 가치를 계속해서 상승 시키고 있습니다. 전문 IT 기업 뿐만 아니라…
Continual Reinforcement Learning
[선행연구팀 이정우] 최근의 강화학습은 다양한 과제에서 AI agent가 인간의 성능을 압도할 수 있음을 보여줬습니다. 하지만, 학습되지 않은 AI agent는 사람과…
MetaHuman Creator – Unreal Engine
[서비스개발팀 김병인] MetaHuman Creator 는 에픽게임즈에서 최근 공개한 디지털 휴먼 제작툴입니다. MMORPG 게임의 캐릭터 생성과 비슷해보지만 이러한 리얼타임 디지털 휴먼을…
언어모델에서의 자연어 생성 전략
[선행연구팀 김성현] 최신 언어 모델은 대규모의 코퍼스를 이용해 학습합니다. 특히, GPT-2, BART, T5 모델과 같이 디코더 신경망을활용한 모델의 경우, 다음…
일상을 기록하는 Lifelogging
[서비스개발팀 권은지] 라이프로깅(Lifelogging)이란 라이프(Life)와 로그(Log)가 합쳐진 단어이며 1945년 미국의 국가 과학기술연구소의 소장 바네바 부시가 ‘Atlantic Monthly’에 기고한 ‘As We May…
Graph transformer: 구조화된 데이터를 위한 transformer
자연어 처리 분야에 적용하기 위해서 만들어진 transformer는 최근 텍스트 뿐 아니라 이미지나 동영상과 같은 다양한 데이터에 대해서도 적용되어 우수한 성능을…
GPT-3 기반의 게임 NPC 데모
10년전 게임과 현재의 게임을 비교해 보면, 특히 그래픽 측면에서 많은 차이가 있습니다. 예를 들면, 4K 이상의 해상도, 정교한 그래픽 텍스춰,…