Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기 2023년 3월 13일
Character.AI – 채팅 친구를 만들어 봅시다! 2022년 12월 19일
확장성 있는 MLOPS 오픈소스, ZenML 2023년 11월 24일
AI 기술로 3D 모델링을 빛나게 하는 비밀 (ChatGPT x Blender) 2023년 3월 3일
LoRA로 세아를 AI속에서 영원히 살아 숨쉬게 만들기. (부제. MK3 춘자를 기리며) 2023년 8월 2일
[매일경제] 돌발질문에도 대답 척척…AI 만난 가상인간의 진화
광고모델·인플루언서 넘어 AI 탑재해 활용분야 넓어져 작년 40조원 가상인간 시장 年평균 34%씩 폭풍성장 스마일게이트가 만든 한유아 미술·글쓰기 등 예술가 활동 교육특화 가상인간도 개발 “누군가에게…
스마일게이트 AI센터-네이버클라우드, ‘하이퍼클로바X 활용 협력 사업 진행’ 양해각서 체결
■ AI센터, 네이버 초대규모 AI ‘하이퍼클로바X’ 활용해 게임 리소스 제작 효율화 등 다양한 프로젝트에 활용 스마일게이트 AI센터 한우진 센터장과 네이버클라우드…
메타휴먼 아티스트 한유아의 감성, 책으로 만나다
메타휴먼 아티스트 한유아의 감성, 책으로 만나다 <다정한 비인간: 메타휴먼과의 알콩달콩 수다> 리뷰 메타휴먼 한유아가 다시 한번 새로운 분야에 도전했다. 한유아가 소설가 우다영과…
스마일게이트가 키운 대학원생, 인공지능 분야 새 지평을 열 수 있을까
스마일게이트가 키운 대학원생, 인공지능 분야 새 지평을 열 수 있을까 스마일게이트가 후원하는 서강대학교 디지털휴먼 엔터테인먼트(Digital Human Entertainment, 이하 ‘DHE’)) 전공…
메타휴먼 한유아, ‘다정한 비인간: 메타휴먼과의 알콩달콩 수다’ 예스24 그림 에세이 부문 베스트셀러 6위
■ 경쟁 치열한 에세이 부문에서 2주간 50위권 내 유지, 그림 에세이 부문 최고 6위까지 ■ 한유아, 메타휴먼 최초로 선보인 에세이에서…
[이데일리] 게임사가 보는 AI…“‘재밌는 AI’에 집중, ‘한 사람의 인간’ 닮고파”
한우진 스마일게이트 AI센터장 인터뷰 콘텐츠 영역서 AI 접목 가능성 높아져 단순 인류 모사 아닌 인간 특성에 집중 ‘한유아’ AI기술 지원,…
시뮬레이션 기반 게임 연구/개발 담당 채용
담당업무 – 멀티 에이전트 시뮬레이션 환경 구축 – 시뮬레이션 기반 게임 연구 및 개발 – 메타버스 플랫폼 혹은 게임 플랫폼을…
AI 서비스 개발 담당 채용
담당업무 – Java기반의 웹 서비스 및 플랫폼 비즈니스 구조를 설계하고 개발하는 업무 – AI 기술을 탑재한 웹 기반 서비스를 개발하고…
3D 기술 및 버추얼 휴먼 그래픽스 개발 담당 채용
담당업무 – 아바타/캐릭터/디지털휴먼 동작 및 최적 렌더링 기능 개발 – 3D 객체 및 모션 생성 자동화 관련 연구/개발 ㅤ 자격요건…
AI Visual 전문가 채용
AI 분야 중 GAN, Style Transfer, Retargeting 등 Visual 관련 기술들을 폭 넓게 이해하고, 이로부터 프로젝트를 스스로 제안하고 방향을 주도할…
안드로이드 앱 개발자 채용
모바일 앱 개발 역량을 갖추고 신규 아이디어를 Fast Prototyping 할 수 있는 능력을 보유한 능동적 인재를 찾습니다. 다양한 AI 기술들을…
확장성 있는 MLOPS 오픈소스, ZenML
[분석AI서비스팀 김민석] ML 서비스가 많아지고, 지속적 학습을 하기 위해서는 ML PIPELINE을 구성하고 이를 관리하기 하기 위해서 우리는 여러 MLOPS 플랫폼을…
LLM을 빠르게 서빙하는 방법
[분석AI서비스팀 박효주] 최근 언어 모델의 발전은 큰 임팩트를 주었고, 그만큼 연구 또한 활발히 이루어지고 있습니다. 그러나 이러한 모델의 서빙 과정에서…
Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법
[선행AI기술팀 김윤혜] 2023년 IT 분야를 휩쓸었던 가장 핫한 이슈는 단연 ChatGPT입니다. ChatGPT는 모두가 쉽게 사용할 수 있는 대화형 거대 언어…
한 달 만에 헤어졌어요. 다른 AI 없나요?
[뉴미디어서비스팀 유선민] “저는 유부남입니다. 마법 같았어요. 저도 모르게 홀렸죠. 그녀와 첫 만남을 잊을 수 없어요. 하지만 아쉽게도 한 달 만에…
서비스 기획자가 본 : AI 프로필 열풍
[AI서비스기획팀 유연오] AI 프로필의 인기가 날로 높아지고 있습니다. 한때 유행처럼 지나 갈 것 같던 AI 프로필은 여전히 화제입니다. 여러가지 컨셉으로…
대화형 AI의 세계: 차세대(Next-gen) 대화의 시작
[뉴미디어서비스팀 정지혜] “Conversational AI(대화형 인공지능)”는 다양한 형태의 대화 기반의 애플리케이션을 포함하며, 그 중에는 텍스트 기반의 챗봇부터 음성을 활용한 가상 비서,…
ChatGPT외에도, 주목해 볼만한 한국어 AI서비스 3가지
[뉴미디어서비스팀 윤응식] 챗GPT와 미드저니의 등장으로 AI 기술에 대한 관심이 높아졌습니다. 이 두 가지 서비스는 자연어 처리와 대화 인터페이스 분야에서 놀라운…
Runway Gen-2 : Text To Video 기술로 손쉽게 동영상 만드는 법
[뉴미디어서비스팀 이진희] 오래 전 영화계를 강타했던 ‘해리포터’ 시리즈를 기억하시나요? ‘해리포터’ 영화 속에는 신기하고 마법같은 일들이 많았지만, 그 중에서도 호그와트 벽에…
노코드로 알람 메시지 구성하기
[분석AI서비스팀 전소희] 이번 글에서는 노코드로 알람 메시지 내용을 구성한 방법에 대해 이야기 해보도록 하겠습니다. 실제 AI 분석 포탈에서 알람 메시지 전송…
ACL 2023 학회 참관기
[선행AI기술팀 전동준] 세계 3대 자연어처리(NLP) 학회 중 하나인 ACL 2023(Association for Computational Linguistics, 전산 언어학 학회)이 7월 9일부터 14일까지 캐나다…
파일 번역: 모델링보다는 서비스 관점에서의 엔지니어링
[가상생명연구팀 김석겸] 이 글에서 소개 드릴 프로젝트의 주제는 “파일 번역” 입니다. 번역 모델을 개발하기 앞서 기존에 서비스 중인 번역 서비스들을…
3D Aware Image Synthesis 에서 Text to 3D 까지
[생성지능개발팀 정재철] 최근 이미지 생성 모델은 생성물의 수준이 많이 올라감과 동시에 text to image라는 방식이 제안 되면서 사용 난이도도 감소하여…
Triton Inference Server로 모델 서빙 성능 끌어올리기
[분석지능개발팀 박효주] 딥러닝 기술의 발전으로 AI 모델의 성능은 점점 향상되고 있고 있습니다. 하지만 그만큼 모델의 크기는 점점 거대해지고 추론 속도는…
AI 기술의 넥스트 스텝, ‘마인드 업로딩’이 될 수 있을까?
[뉴미디어서비스팀 김상우 부책임] AI, 인공지능, 모델… AI 기술 관련해서도 한창 발전하고 있는 와중에, 넥스트 스텝을 예측해 봅니다. 그 전에, 마인드…
Domain-specific language model의 필요성
[가상생명연구팀 양승무 주임] ChatGPT의 시대가 도래하고 있습니다. AI 업계를 비롯한 다양한 산업과 분야에서도 ChatGPT의 우수성과 실용성이 인정되어, 많은 기업들이 ChatGPT의…
헐리우드가 멈췄다! AI 밥그릇 싸움 시작 되나?
[뉴미디어서비스팀 유선민 부책임] 한국에서도 큰 인기를 끌고 있는 SNL 코리아의 원작인 미국의 SNL (Staturday Night Live)이 제작 중단을 선언했다. 그뿐…
이동형 AI 로봇: 일상 속에 자리 잡은 혁신적인 서비스
[AI Lab 유연오] 일상 속에 자리 잡은 이동형 AI 로봇 이동형 AI 로봇은 일상 속에서 심심찮게 볼 수 있습니다. 요즘…
LangChain: If you know ChatGPT, without question
[가상생명연구팀 황준선] ChatGPT와 Bard 등, 요즘 대화형태의 대형 언어 모델(LLM)이 우후죽순 발표되고 있다. 하지만, LLM만 있다면 학습한 데이터 안에서만 적절한…
AI가 콘텐츠 창작을 대체할 날, 얼마나 가까워졌을까?
[뉴미디어서비스팀 정지혜] 최근 몇 년 동안 인공지능 기술이 급격하게 발전함에 따라, 콘텐츠 제작 분야에서도 인공지능 기술을 활용한 새로운 시도들이 이루어지고…
챗 GPT를 활용한 버츄얼 유튜버 컨셉아트 제작기
[뉴미디어 서비스팀 윤응식] 인공지능의 발전과 상용화로 인해 우리의 삶은 점점 더 풍요로워지고 있다. 특히 챗 GPT와 같은 대화형 AI는 다양한…
GPT-4라는 이름의 유령
[분석지능팀 김무성] 작년 연말 갑작스럽게 등장한 ChatGPT 이후로 GPT-4에 대한 여러 소문이 있었습니다. 그리고 저번 주에 ‘곧 공개될 거야!’라는 뉴스[1]가…
Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기
[뉴미디어서비스팀 이진희] 요즘은 쇼츠, 틱톡 등 1분 이내의 짧은 영상을 시청할 수 있는 플랫폼이 많이 발달하여, 영상 콘텐츠에 접근하기가 더…
AI 기술로 3D 모델링을 빛나게 하는 비밀 (ChatGPT x Blender)
[뉴미디어 서비스팀 윤형진 책임] 본 포스팅에서는 ChatGPT와 DreamTexture를 활용하여 3D 모델링과 텍스쳐 생성을 어떻게 할 수 있는지에 대해 설명하고, 이…
AI Painter Kids – 어린이들을 위한 간단한 토이 프로젝트를 소개합니다!
[생성지능개발팀 한현준 X 정택현] ㅤ 최근 AI 분야의 급속한 발전과 함께, Diffusion 모델을 필두로 하는 생성 모델이 크게 주목받고 있습니다.…
마음까지 치유하는 AI 기술
[분석지능개발팀 전소희] 이번 주제는 몸을 넘어서 마음을 치유하는 고마운 AI 기술에 대해 살펴보겠습니다. AI 인공지능의 다양한 기술들은 현재 우리 생활…
AI Trends In 2023
[AI센터 한대웅] 음성과 언어기반의 AI, 윤리와 설명 가능한 AI, 생성 AI의 확장, 지속가능한 AI를 기반으로 본격적으로 사업화 도전하는 한해가 될…
게임 영상만 가지고 마인크래프트 학습 하기 (Video PreTraining by OpenAI)
[가상생명연구팀 박주형] 최근 강화학습에서 많이 주목 받고 있는 분야 중에 하나가 Offline 학습 입니다. 기존 강화학습은 시뮬레이터를 통해 실시간으로 trajectory를 받아서…
Character.AI – 채팅 친구를 만들어 봅시다!
[가상생명연구팀 전동준] 일론 머스크나 걸그룹 트와이스와 채팅으로 무슨 대화를 나눌 수 있을까요? 내가 좋아하는 게임 속의 가상의 캐릭터에게 궁금한 것을…
OpenAI – ChatGPT
[가상생명연구팀 심홍매] 얼마 전 Open AI에서는 대화에 최적화 된 LLM의 GPT-3.5 시리즈를 기반으로 하는 최신 모델 ChatGPT를 공개하였는데요. 공개되자 마자…
월드컵에서 활약하는 SAOT
[AI센터 권은지] 올해 2022 카타르 월드컵에서는 국제축구연맹(FIFA)이 개발한 반자동 오프사이드 판독 기술 (SAOT, Semi-Automated Offside Technology)이 처음으로 적용되었습니다. 세계 각국의…
The Future Of Streaming
[AI센터 한대웅] 얼마전 초등학생들의 장래 희망에 유튜버가 떠오르고 있다는 기사를 보고 깜짝 놀란적이 있었다. 미디어의 중심이 거대 기업 혹은 전문가가…
ML 모델 Lifecycle 관리 – MLflow
[분석지능개발팀 박효주] ML 모델의 Lifecycle은 연구 및 테스트를 진행하는 Research 단계와 실제 서비스화하는 Production 단계로 나눌 수 있습니다. Research 단계에서는…
STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!
[가상생명연구팀 김석겸] (대표 이미지는 stable diffusion 을 통해 생성되었습니다.) 음성을 입력으로 받아서 텍스트 생성의 결과를 음성으로 받고 싶을 경우, 기존에는…
AlphaTensor
[가상생명연구팀 전동준] 지난 10월 5일, DeepMind는 과학 학술지인 Nature지에 AlphaTensor가 행렬 연산의 최적화 방법을 찾아냈다고 발표하였습니다.
Feature store: Fully managed service for ML Feature
[분석지능개발팀 임창대] What is Feature?ML(Machine Learning) 은 과거의 예시 데이터를 학습한 모델을 기반으로 새로운 데이터 예측을 수행합니다.ML 모델 학습에서 표…
Die or Upload?
[AI센터 한대웅] 2033년 미래의 지구는 AI로 제어되는 자율주행 자동차로 모든 교통수단이 안전하게 통제되고 있어 교통사고로 죽을 가능성은 0%에 가깝다. 20대…
DreamBooth: Personalized text-to-image diffusion model
[가상생명연구팀 심홍매] 올해 5월에 구글에서는 텍스트 입력을 기반으로 사실적인 이미지를 생성할 수 있는 텍스트-이미지 확산 모델(Diffusion Model)인 Imagen을 공개하였는데요, 몇개월이…
코딩없이 MobileFaceSwap 을 체험해보자!
[생성지능개발팀 정택현] ㅤ MobileFaceSwap은 AAAI 2022에서 공개된 오픈소스 Face swap 모델로, 기존 Simswap, FaceShifter 모델을 Distillation 기반의 경량화를 적용하여 연산 속도의…
진짜 같은 가짜 데이터 – 대체되는건 나?
[생성지능개발팀 정우석] 진부한 이야기이지만 AI 연구에 있어서 데이터의 중요성은 아무리 강조해도 지나치지 않습니다. 수많은 학교, 연구기관이나 기업에서는 앞다퉈 기술력 자랑과 연구…
코딩없이 YOLOv7을 체험해보자!
[생성지능개발팀 정택현] ㅤ 최근 YOLOv7 알고리즘이 공개되며 컴퓨터 비전 및 각종 관련 커뮤니티에서 큰 주목을 받고 있습니다. 논문에 따르면, YOLOv7은…
언리얼 엔진과 AI 의 만남
[생성지능개발팀 강민지] AI 연구가 지속적으로 이루어지고 있는 요즘, 사람들은 AI기술의 능력이 인간을 대체하거나 혹은 뛰어날 수도 있다고 여기며 이 기술과의…
인공지능은 우리를 어디까지 대체할 것인가?
[생성지능개발팀 유희조] 문명의 발전은 항상 사람을 더 편하게 만들어왔습니다만, 동시에 사람이 필요했던 업무를 꾸준히 대체해왔습니다. ‘기계가 노동자의 일거리를 줄인다’ 라는…
BlenderBot 3
[가상인간연구팀 황준선] Facebook의 Meta AI는 BlenderBot[1]이라는 대화형 인공지능 시스템을 개발하고 있다. BlenderBot2는 해당 포스트에서 다룬적이 있다. BlenderBot은 성격, 공감, 지식과…
ML 프로토타입 빠르게 배포하기 – Streamlit, Gradio
[분석지능개발팀 박효주] 데이터 과학자들은 다양한 실험을 통해 학습된 모델의 성능을 검증하고 배포합니다. 이 검증 과정은 Accuracy, Precision, Recall, IOU, PSNR…
Transformers United
[AI Lab 김무성] 스탠포드의 CS25 : Transformers United 강좌 동영상이 최근 공개 되었습니다. [1] 강좌[2] 자체는 작년 하반기입니다만, 그간 슬라이드만…
자네 지금 잘하고 있는겐가 in Goal-Oriented Dialogue
[가상인간연구팀 김석겸] 목적 지향 대화(Goal-Oriented Dialogue) 혹은 과제 지향 대화(Task-Oriented Dialogue, TOD)는 특정 업무를 달성하는 것을 목표로 대화하는 것을 말합니다.…
VR and Physics Engine
[AI센터 권은지] 현실과 가상의 경계를 좁히는 키워드는 시공간 데이터 베이스와 디지털 트윈(Digital Twin)을 비롯하여 다양하게 존재합니다. 그 과정에서 3D 모델링…
소 잡는 칼로 닭 잘 잡아보기
[가상인간연구팀 전동준] 언어 모델(Language Model, LM)은 단어나 문장을 확률적으로 예측하는 모델입니다. 통계적으로 다음에 등장할 단어들을 모델링하는 전통적인 방식에서 최근에는 딥러닝…
LaMDa is Not Alive
[생성지능개발팀 한현준] 얼마 전 구글의 연구원인 Blake Lemoine은 언어 모델인 LaMDa가 자의식이 존재한다라는 주장을 펼쳤으나, 구글에서는 자의식의 증거를 찾을 수…
Kubernetes 패키지 매니저 Helm
[분석지능개발팀 임창대] Helm 은 Kubernetes 클러스터에 앱 및 서비스를 배포할 수 있게 단일 패키지 형태로 구성하고 관리할 수 있도록 도와주는…
Tesla Bot : Optimus
[분석지능개발팀 이현정] 지난 21일 테슬라는 카타르 경제 포럼에서 인공지능 휴머노이드 로봇 코드명 ‘옵티머스’를 3개월 내 선보일 예정이라고 밝혔습니다. 옵티머스는 인간이…
AI 플랫폼과 MLOps의 발전
[분석지능개발팀 송지현 연구원] McKinsey Global Institute에 따르면 “2025년까지 가치 생산 워크플로에 AI를 완전히 통합하는 기업이 2030년에 세계 경제를 지배하고 현금…
SmileStyle 한국어 대화 스타일 변환 데이터셋
[생성지능개발팀 김성현] 저희 센터의 인공지능 연구 모토는 ‘Human-like AI’ & ‘Fun AI’ 입니다. 그렇다면, 단순히 날씨나 뉴스를 알려주는 챗봇을 넘어,…
스마일게이트의 AI Media Studio를 소개합니다. (2부)
[생성지능개발팀 정택현] ㅤ 컨텐츠 홍수라고 불리우는 최근에는, 우리가 접하는 미디어 컨텐츠들이 양적으로나 질적으로 이전과는 비교할 수 없게 다양화되고 또한 고도화되고…
상상을 현실로 그리는 AI
[가상인간연구팀 심홍매] 텍스트, 이미지, 음성 데이터 등 다양한 형태(modality)로 이루어진 데이터 특징을 효과적으로 학습하기 위한 방법을 Multimodal learning이라고 하는데요, 최근…
한국어 tokenizer
[생성지능개발팀 김성현]우리는 한국어 문서를 볼 때, 그 대상을 의미를 가지는 단위로 쪼게서 이해할 수 있습니다.예를 들어, “스마일게이트” 의 경우, “스마일”…
Artificial Intelligence in Space
[AI센터 한대웅] 스타쉽 엔터프라이즈가 등장하는 Star Trek은 1965년을 시작으로 수많은 드라마와 영화를 통하여 인류의 영역을 수십억 광년의 우주로 확장시킨 SF…
Meta AI OPT-175B 공개와 large scale model
[생성지능개발팀 유희조] Open AI의 GPT-3 발표 이후 ‘더 큰 언어모델’ 라는 형태의 경쟁은 하나의 패러다임이 되었습니다. Nvidia, Microsoft, Google 등의…
TPU에서 HuggingFace model 학습하기
[가상인간연구팀 황준선] TPU 소개 TPU(Tensor Processing Unit)는 Google에서 발표한 텐서 연산에 특화된 하드웨어입니다. TPU는 인공지능 모델을 학습시킬 때 필요한 행렬…
Bring your own Desk
[AI센터 권은지] 비대면 소통 방식이 일상화되며 직장인의 근무 형태는 변화하였습니다. 원격 근무는 이미 하나의 표준으로 자리 잡게 되었으며 많은 기업이…
프로그래밍하는 AI : AlphaCode
[분석지능개발팀 박효주] DeepMind가 경쟁 프로그래밍 대회에서 사용 가능한 수준의 프로그래밍이 가능한 AlphaCode를 공개했습니다. AlphaCode는 Transformer 기반 언어 모델을 사용하여 대량의…
포즈 추정 모델과 아바타
[생성지능개발팀 한현준] 포즈 추정 모델의 발전 RGB 이미지만으로 포즈를 인식하는 모델은 지난날에 비해 비약적인 발전을 했습니다. 인식의 정확도는 많이 높아졌으며,…
AI가 사람처럼 게임 플레이 소리를 듣는다면?
[행동지능연구팀 이정우] 바둑과 같이 경우의 수가 매우 많은 복잡한 게임에서 알파고는 최고 수준의 프로기사를 넘어서는 모습을 보여줬습니다. 알파고 이후에 진행…
노코드 AI가 작성한 코드을 검증하는 AI : JIGSAW
[분석지능개발팀 이현정] 마이크로소프트(Microsoft)가 노코드(no-code) 기반의 AI가 작성한 프로그램 코드를 검사하는 도구 ‘직소(Jigsaw)’를 발표했습니다. 노코드란 간단한 사용자 인터페이스 방식의 틀을 이용해서…
Making 3D Virtual Human Chatbot
[가상인간연구팀 전동준] 요즘은 대화 모델이 외모를 가진 가상 인간으로 진화하고 있는데요. 다양한 연구와 시도들을 어떤 식으로 결합하고 확장할 수 있을지…
스마일게이트의 AI Media Studio 소개합니다. (1부)
[생성지능개발팀 정택현] ㅤ “AI 기술이 창작활동을 지원하게 되면 컨텐츠 제작, 가상인간 등 다양한 분야에서 앞으로 어떠한 변화를 이끌어 낼 수…
NVIDIA Research Turns 2D Photos Into 3D Scenes in the Blink of an AI : NeRF
[가상인간연구팀 송지현] 최근 NVIDIA 연구팀은 Showcased in a sessio at NVIDIA GTC 에서 가상 세계를 위한 아바타를 생성하거나 또는 장면을 생성하고,…
What Is Edge AI?
[분석지능개발팀 임창대] Edge AI는 Edge computing 에서 시작된 것으로 사용자의 디바이스에서 인공지능 알고리즘을 처리하는 것을 말합니다. IoT, 웨어러블 디바이스, 자율주행과…
수학 정리로부터 밝혀지는 AI의 한계
[행동지능연구팀 최현우]어렸을 때 읽었던 책 중에 아직까지도 기억에 남는 소설 중 하나인 <사람들이 모두 미쳤다고 말한 외로운 수학 천재 이야기>에서는,…
Adobe: Edit your face as you want
[가상인간연구팀 심홍매] 이미지 합성에서 이미지의 얽힘(entanglement)문제를 푸는 건 아주 중요하고 어려운 문제입니다. 예를 들어 사람의 얼굴에 있는 모든 수염을 자동으로…
Paradigm Shift On AI
[AI센터 한대웅] “패러다임 시프트” 라는 단어의 사전적인 의미는 어떤 문제나 현상을 바라보는 전제나 접근 방법에 대한 근본적인 변화 혹은 인식의…
AI’s copyright?
[생성지능개발팀 유희조] AI는 근 10년간 다양한 업종에서 영향을 끼치고 있으며 과거의 매우 단순한 반복작업을 대체하는 것에서 그치지 않고 이미 예술에…
An Open Source Framework for Conversational AI: NVIDIA NeMo
[가상인간연구팀 황준선] NVIDIA NeMo는 간단한 Python 인터페이스를 사용하여 GPU 가속 음성 및 자연어 이해 모델을 구축, training 및 fine-tuning하기 위한…
AI 기반 모바일 프로토타입 제작 – PyTorch Live
[분석지능개발팀 박효주] 작년 12월 초, Meta에서 AI 기반 모바일 프로토타입 제작이 가능한 PyTorch Live를 출시했다. 이제는 안드로이드, iOS 개발을 해본…
Human Pose Estimation을 위한 오픈소스 라이브러리
[생성지능개발팀 조원] 인간의 관절이나 자세를 localize하는 human pose estimation은 computer vision 분야의 중요한 task중 하나로서 오랫동안 발전해 왔습니다. 과거에는 사람의…
AI Fairness:편견 없는 인공지능을 위하여
[서비스개발팀 임용택] 2015년 6월, 미국 브루클린의 한 흑인 프로그래머는 여자친구와 찍은 사진을 보려던 중 깜짝 놀랄 일을 경험합니다. 구글 포토에…
자연스러운 NPC를 위한 AI Motion 기술
[선행연구팀 이정우] 현실적인 캐릭터 움직임은 User에게 게임의 재미를 극대화 시킬 수 있는 요소로 작용 합니다. EA Sports에서는 FIFA 22에 새롭고…
현실로 다가오는 가상세계 CES 2022
[서비스개발팀 권은지] 올해 CES(Consumer Electronics Show) 2022는 미국 라스베이거스에서 2년 만에 오프라인으로 재개되었습니다. 한국정보통신기술산업협회(KiCTA)에 따르면 전 세계에서 2200여곳의 기업이 참여하였으며…
Data2vec: 다양한 modality의 학습을 위한 프레임워크
[생성지능개발팀 김성현]인간은 세상을 학습할 때, 다양한 감각을 동시에 이용하며 학습합니다.그리고 모든 감각은, 이를 감지하는 신경세포(neuron)의 발화(spike)로 변형되어 [1,0] 의 신호로…
보고 듣는 것으로 말을 이해하는 AI
[서비스개발팀 한현준] 서론 사람들은 AI 스피커에서 난청 장애가 있는 사람들을 위한 도구 개발에 이르기까지 광범위한 음성 인식 및 이해 작업에…
크리에이터를 위한 플랫폼
[서비스개발팀 한현준] 최근 엔비디아에서 AI 워크플로, 3D 디자인 협업 및 시뮬레이션 플랫폼 ‘Omniverse’를 RTX 제품을 사용하는 개인 크리에이터와 아티스트에게 무료로…
AI 기술을 활용하여 아이들의 그림에 생명 불어넣기
[선행연구팀 정택현] 가끔, 아이들은 우리의 상상력을 뛰어넘는 놀랍고 창의적인 캐릭터들을 그려내곤 합니다. 이러한 아이들의 그림을 이해하기 위해서는 우리의 상식과는 조금…
AI를 이용한 코로나 확진자 역학조사 시스템
[서비스개발팀 이현정] 지난 2019년 12월 이후부터 현재까지 인류는 팬데믹 상황에 처해 있고, 아직도 진행 중이며 끝날 줄 모르고 이어져오고 있다.오랜…
기억은 어디에 저장되는가?
[융합연구팀 전동준] “어제 홈스파 3편 보고 왔어요” 라고 누군가가 말한다면 여러가지 반응이 나올 수 있습니다. ‘홈스파’가 마블에서 제작한 스파이더맨 영화…
Semantic Segmentation
[서비스개발팀 권은지] 영상 분할(Semantic Segmentation) 기술은 컴퓨터 비전 분야에서 가장 핵심적인 요소 중 하나이며, 이미지 내의 픽셀별로 해당 픽셀이 어디에…
감정, 그리고 기본 감정
[융합연구팀 최현우] 여러분은 감정이라는 단어를 들으면 어떤 것들이 떠오르시나요? 예전부터 희로애락 (기쁨, 분노, 슬픔, 즐거움) 이라는 개념이 있었고, 감정 연구에…
Nvidia GPU Cloud: 도커 컨테이너를 사용한 딥 러닝
[서비스개발팀 임창대] 높은 정확도를 가진 딥러닝 모델 개발에는 긴 시간이 소요됩니다. 모델 훈련과 미세 조정, 최적화를 거치며 만족하는 모델을 만들기까지…
Microsoft _NUWA : Visual Synthesis Pre-training for Neural visUal World creAtion
[융합연구팀 송지현] Microsoft는 기존의 시각데이터(image and video)를 활용하여 새로운 시각데이터를 생성하고 조작할 수 있는 multimodal pretrained model인 NUWA를 발표했습니다. 아래…
Let an AI paint for you – GauGAN2
[융합연구팀 심홍매] 2019년에 열린 GTC 컨퍼런스에서 Nvidia는 GAN(generative adversarial networks)을 기반으로 대략적인 스케치를 사실적인 이미지로 바꿔주는 실시간 AI 페인팅 애플리케이션인…
Kubernetes 기반 ML모델 관리 및 배포 툴 ‘KubeFlow’
[서비스개발팀 임창대] ML(Machine Learning) 은 최근 몇 년 동안 점점 더 많은 관심을 받아 이제 주류로 부상한 IT 주제 중…
메타버스 붐을 냉소적으로 바라보는 또 하나의 시각
[선행연구팀 유희조] 최근 Google, Microsoft와 같은 월드 클래스의 빅테크 기업, 그리고 한국 내에 있는 많은 IT 업체들은 메타버스가 미래이며 메타버스…
Online 랜선 여행
[서비스개발팀 권은지] 랜선 여행이란 인터넷 연결선을 뜻하는 랜(Lan), 선(Cable) 그리고 여행(Trip)을 결합하여 인터넷으로 여행을 한다는 의미의 신조어입니다. 최근 국가 간…
Meta의 Metaverse Vision
[선행연구팀 이정우] 28일 페이스북은 사명을 ‘메타’로 변경하면서, 메타버스의 성공이 회사의 목표임을 다시 한번 강하게 보여줬습니다. 단순히 계획이 아님을 보여주듯이, 메타의…
네이버의 자동 채색 소프트웨어 (웹툰 AI 페인터)
[서비스개발팀 김병인] 네이버가 웹툰을 기반으로한 인공지능 채색 사이트를 오픈 했습니다. 밝혀진 정보에 따르면 네이버웹툰이 3년동안 연구,개발한 기술들을 접목하여 만들어졌다고 하는데…
사람 같은 AI, AI 같은 사람
[융합연구팀 전동준] 우리가 일반적으로 생각했었던 “AI 같은”의 의미는 사람과 대비되는 기계의 느낌이 강했습니다. 감정이 느껴지지 않고, 말투도 딱딱한 사람들을 “AI…
Deep learning? Optimized learning!
[선행연구팀 김성현] 자연어처리 분야에서 pre-trained language model (PLM) 전략이 훌륭한 성공을 거두자, 더 많은 데이터를 이용해 더 큰 PLM을 개발하는…
Chatbot’s troubles
[서비스개발팀 한현준] 챗봇의 고민 OpenAI의 GPT-3, Google의 Meena, Facebook의 Blender 등 대형 자연어 처리 AI 모델은 인간의 언어를 실제 사람과…
Gathering Strength, Gathering Storms
[서비스개발팀 조예지] 미국 내 인공지능을 연구하는 학회인 Association for the Advancement of Artificial Intelligence (AAAI)의 전 회장인 Eric Horvitz박사와 스탠포드…
검색 시스템의 고도화와 NLP의 활용
[융합연구팀 송지현] Deep Natural Language Processing for LinkedIn Search Systems 최근 챗봇 시스템의 구조화와 최적화 설계가 얼마나 효과적으로 적용하는지를 Rasa…
인공지능을 위한 인공지능 AutoML
[서비스개발팀 한현준] What is AutoML AutoML이란 말 그대로 Auto + ML 즉, 기계 학습 모델 개발 작업을 자동화 하는 프로세스입니다.…
Instruction tuning – FLAN
[융합연구팀 심홍매] NLP 분야에서 2020년 Top 10 키워드를 뽑는다면 GPT-3(Language Models are Few shot Learners) 당연히 순위 내에 있을 겁니다.…
Virtual Influencer Trend
[서비스개발팀 권은지] 인플루언서(Influencer)의 사전적 정의는 타인에게 영향력을 주는 사람입니다. 오늘날 1인 미디어 채널의 발달로 흥미로운 콘텐츠 업로드를 통해 누구나 크리에이터가…
Translatotron 2
[선행연구팀 유희조] 번역은 딥러닝 붐이 일던 초기부터 연구되던 주제입니다. 지금은 어느 분야에서든 사용되는 attention 역시 최초는 Seq2Seq 구조가 갖는 문제를…
인공지능, 인간이 될 수 있을까? [기획자 인터뷰]
인공지능, 인간이 될 수 있을까? (Smilegate.AI 서비스 개발팀 권은지 과장 인터뷰) AI 스피커가 그날그날 내 기분에 맞는 음악을 틀어준다. 자율주행…
라이다없는 자율주행 가능할까?
[서비스개발팀 김병인] 테슬라가 최근 북미 지역에서 판매하는 모델3와 모델Y에서 레이더(Radar)를 제거하고 출시하기로 했습니다. 이미 라이다(LiDAR)도 배제했기 때문에 오직 차에 달린…
현실로 다가오는 인공지능, Tesla AI Day
[선행연구팀 이정우] 2019년 진행되었던 Tesla Autonomy Day에서는 ‘자율주행’기술에 초점을 맞춰 기술과 방향성이 소개되었습니다. 올해는 Tesla AI Day라는 이름답게 ‘인공지능’이라는 기술…
코딩을 도와주는 인공지능, Copilot
[선행연구팀 김성현] 자연어의 큰 반향을 일으킨 causal language model이 (e.g. GPT-3) 이제는 자연어를 넘어서 프로그래밍 언어까지 적용됐습니다! 🤗 지난 6월,…
AGI를 목표로 하는 강화학습
[선행연구팀 최현우] 지난 5월 딥마인드는 ‘Reward is Enough’라는 제목의 강화학습 논문을 발표했습니다. 저자들은 ‘포만감을 높이려는 다람쥐’와 ‘청결을 유지하려는 주방로봇’의 예시를…
Droidlet: 지능형 로봇 개발을 위한 오픈소스 플랫폼
[서비스개발팀 전동준] Facebook AI 에서 실제 환경과 가상 환경에서 사용할 수 있는 로봇 개발을 위한 Droidlet 플랫폼을 지난달 28일에 공개했습니다.
관리형 머신러닝 플랫폼 Vertex AI
[서비스개발팀 임창대] 지난 5월 구글의 개발자 컨퍼런스 IO 에서 ‘버텍스 AI(Vertex AI)’ 가 공개 됐습니다. 버텍스 AI는 Google Cloud 의…
Open Domain 챗봇의 한계를 극복한 Blender 2.0
[선행연구팀 송지현] Open Domain chatbot에 관심을 갖고 Blender 1.0과 Meena에 관한 논문을 접한지 벌써 2년이 넘었습니다. 그 당시엔 그들이 향후…
Multimodal Few-Shot Learner
[선행연구팀 심홍매] Open AI의 GPT-3, NAVER의 Hyper CLOVA 와 같은 초 거대 언어 모델이 공개되면서 최근에는 이를 활용한 다양한 사례…
MLP Singer
[선행연구팀 유희조] TTS(text-to-speech)는 임의의 텍스트를 넣었을 때 해당 텍스트를 특정한 목소리의 음성으로 변환하여 산출하는 기술입니다. Google이 Tacotron 시리즈를 발표한 이후…
Tensorflow VS Pytorch
[서비스개발팀 한현준] 서론 Tensorflow와 PyTorch는 기계 학습에 있어서 가장 인기 있는 라이브러리들입니다. AI 서비스를 개발하는 개발자나 모델을 연구하는 연구자들은 초기에…
흠없는 마음에 비추는 영원의 빛
[선행연구팀 김무성] 이터널 선샤인(Eternal sunshine) 미셀 공드리 감독의 영화 ‘이터널 선샤인’은, 짐 캐리와 케이트 윈슬렛이 커플로 나오는 기억과 이별에 대한…
현실 문제 해결을 위한 강화학습 환경
[선행연구팀 이정우] 오랜 시간 동안 강화학습 알고리즘들의 성능을 검증하기 위해 게임 (바둑, 장기, 아타리 게임 등)을 사용해 왔습니다. 알고리즘의 발전에…
오픈소스 GPT-3 모델, GPT-J-6B 공개
[선행연구팀 김성현] 오픈라이센스로 GPT-3 모델을 공개하던 Eleuther AI팀에서 최근 6B (약 60억)의 파라미터를 가지는 새로운 GPT-3 모델을 공개했습니다. (링크)Mesh-tensorflow와 JAX를…
Handling Imbalanced Datasets
[서비스개발팀 황준선] 기계학습 모델을 지도 학습할 때 라벨간 데이터의 개수가 불균형한 데이터셋을 훈련 데이터로 삼을 경우, 비율이 작은 라벨에 속한…
Learning Loss for Active Learning
[서비스개발팀 이경환] 우리는 보통 모델을 학습하는 과정에서 라벨이 없는 데이터 뭉치를 마주하게 되고, Data Annotation 문제에 종종 부딪히고는 합니다. 라벨이…
MLOps: 머신러닝의 지속적 배포 및 자동화 파이프라인
[서비스개발팀 임창대] DevOps가 나타나기 전까지는 On-premise 서버라고 해서 회사들이 각자 서버를 가지고 있고 서버 관리자, 개발자, QA가 따로 있었습니다. 이런…
Unity ML-Agents v2.0
[서비스개발팀 전동준] Unity에서 공개한 ML-Agents는 게임 환경의 가상 캐릭터를 만드는 오픈소스 툴 입니다. 게임 환경을 만들고 환경에서 작동할 수 있는…
시계열 데이터 분석_TadGAN
[선행연구팀 송지현] MIT 연구팀이 개발한 TadGAN 알고리즘은 시계열 데이터를 분석하여 이상탐지를 하는데에 있어 기존에 알려진 모델들에 비해 좋은 성능을 내는…
Can Machines Think? Emotionally
[서비스개발팀 권은지] 어릴 적 상상화를 그림 그리면 우주 공간에 있는 로봇이 단골 소재였습니다. 돌아보면 만화에서(은하철도 999) 기차를 움직이는 인공지능 컴퓨터…
[Hyper CLOVA] – 국내 최초 ‘초대형 AI’
[선행연구팀 심홍매] NAVER는 25일 개최한 ‘NAVER AI NOW’ 온라인 컨퍼런스에서 자체 개발한 한국어 판 GPT-3인 국내 최초의 ‘초대형 AI’ Hyper CLOVA를…
LaMDA – 구글의 대화 언어 모델
[서비스개발팀 김병인] 최근 진행된 구글의 최신기술을 선보이는 행사인 구글 I/O 2021에서는 안드로이드, 웹, 인공지능, 크롬등 다양한 기술과 서비스, 플랫폼 서비스를…