- Character.AI – 채팅 친구를 만들어 봅시다! 2022년 12 月 19일
- RAGAS: RAG 시스템 성능 평가, 이제는 제대로 해보자! 2024년 11 月 18일
- ChatGPT외에도, 주목해 볼만한 한국어 AI서비스 3가지 2023년 9 月 20일
- 오픈소스로 vscode에 나만의 Code Assistant 만들기 2024년 5 月 9일
- Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기 2023년 3 月 13일
뉴스레터 및 문의기능 서비스 중단과 수집된 이메일 주소 삭제에 관한 공지
Smilegate.AI에서 개인정보 처리 및 보호 강화를 위한 노력의 일환으로, 현재 제공하고 있는 뉴스레터 발송 기능 및 문의사항 작성 기능을 당분간…
스마일게이트 메타휴먼 ‘한유아’, 어려운 환경의 결연 아동 찾아 ‘축구장 응원’
■ 한유아 기아대책 호프컵 엠베서더 발탁… 아이들에게 응원과 격려 메시지 전달 ■ 홍보대사로서 일회성 이벤트에 그치지 않고 지속 ‘나눔의 가치’…
2024 스마일게이트 AI 위클리톤 참여자 모집 (~7/7)
AI 위클리톤에서는 새로운 아이디어를 빠르게 검증해보고, 비즈니스 가치를 만들어내는 AI서비스를 만들 수 있습니다. 팀을 넘나들며 같은 목표를 가진 수많은 동료들과…
스마일게이트가 활짝 열어 준, 음성인식 AI 전문가로 성장할 기회
스마일게이트가 활짝 열어 준, 음성인식 AI 전문가로 성장할 기회 2023 한국어 인공지능(AI) 경진대회 최우수상 수상자 박정균 | 서강대학교 대학원 DHE 석사과정…
메타휴먼 한유아, 인간의 고민에 답하다 ‘답장은 우편함에 넣어둘게요 : 메타휴먼 한유아가 사연에 답해드립니다’ 도서 출간
■ 메타휴먼 한유아의 편견 없는 시선과 방대한 지식 및 감성으로 사람들에게 따뜻한 위로와 용기 전해 ■ 생성형 AI 프로그램 기반…
AI 서비스 개발 – 프론트엔드
담당업무 – JavaScript 기반 Frontend 기술을 활용한 AI 기반 서비스 개발 – Backend 서비스와 효과적인 연동을 위한 프론트엔드 구조 설계…
RAGAS: RAG 시스템 성능 평가, 이제는 제대로 해보자!
[Interactive AI 기술팀 김윤혜] RAG(Retrieval-Augmented Generation, 검색 증강 생성) 파이프라인은 대규모 언어 모델(LLM)의 한계를 보완하기 위해 외부 지식을 활용하여 보다…
AI 모름, 진짜 모름 – 가난한 자의 AI 서비스 만들기 (Feat. llama-node )
[Interactive AI서비스팀 임석영] 대 AI 시대가 찾아온 혼돈의 시기에 저 같은 AI 모르는 개발자는 어떻게 AI 서비스를 만들 수 있을까요?…
AI로 개인이 예능 컨텐츠를 만드는 시대
[AI 서비스 기획팀 유연오] 1. 흑백요리사 : AI 패러디 물 등장 최근 넷플릭스에서 흥행을 거둔 시리즈가 있습니다. 바로 흑백요리사입니다. 평소…
LoRA 모델 업그레이드하기
[Creative AI 기술팀 김윤태] 디지털 시대의 빠른 발전과 함께, 인공지능(AI)은 상상만 했던 것들을 현실로 만드는 놀라운 도구가 되었습니다. 그중에서도 Text-to-Image…
‘소드 아트 온라인’은 실재(實在)한다! 미래에는!
[Media AI 서비스팀 김상우] AI 기술 등에 대한 칼럼을 다루는 이 페이지에, 이런 덕후스러운 썸네일을 올리게 된 점 매우 미안하게…
모델 서빙 관리 도구 SELDON-CORE
[Interactive AI서비스팀 김민석] 다양한 규모의 서비스를 개발하고 운영하면서 점점 더 많은 머신러닝 모델을 서빙하게 됩니다. 이 과정에서 기존 모델을 변경할…
2024년을 뒤흔든 생성 AI – Sora, Kling, Dream Machine, Gen-3 Alpha
[Media AI서비스팀 이진희] 최근 텍스트 만으로도 실제와 비슷한 동영상을 제작할 수 있는 생성 AI 서비스들이 우후죽순 등장하며 연일 화제에 오르고…
내가 사용하는 딥러닝 오픈소스 라이브러리의 컨트리뷰터가 되어보자!
[생성AI서비스팀 김경환] 현시대의 개발에서는 “오픈소스 문화”를 떼어 놓고 이야기하는 것이 불가능합니다. 특히 인공지능 분야에서는 Pytorch와 같은 딥러닝 프레임워크에서부터 심지어는 사전…
Model Merging: 모델 병합을 통한 성능 향상 전략
[선행AI기술팀 이지현] Model Merge (모델 병합)은 여러 개의 Large Language Models (LLMs; 대형 언어 모델)을 추가 교육이나 미세 조정 없이…
디퓨전 말고 CFM 들어봤니?
인공지능의 발전은 우리의 삶에 큰 변화를 가져왔습니다. 특히 generative 모델은 이러한 변화의 중심에 서 있습니다. 디퓨전을 기반으로 한 생성 모델이…
AI로 1분짜리 영화 예고편 만들기 [Stable Video / ChatGPT / Midjourney]
“AI를 활용하여 1분짜리 SF영화 예고편을 만들어 보자” [뉴미디어서비스팀 유선민] 물론, 우리가 헐리우드에서 보던 퀄리티는 아니지만 하루만에 뚝딱 책상 머리 앞에서…
언리얼5에서 사용되는 AI 기술 – ML Deformer
[뉴미디어서비스팀 윤형진] AI 기술이 발전함에 따라 게임이나, 영상 쪽에서 사용되는 언리얼5 등의 제작 엔진에서도 관련된 기술을 적용하려는 움직임이 많이 보이고…
오픈소스로 vscode에 나만의 Code Assistant 만들기
[선행AI기술팀 방나모] 최근 몇 년간 자연어처리 기술은 눈부신 발전을 했습니다. 지금은 자연어처리 기술이 많은 산업 분야에 적용되어 사람의 수고를 덜어주는게…
AI로 손쉽게 게임 리소스의 컨셉 아트를 만들어보기!
[생성AI서비스팀 이혜진] 지난 몇 년 동안, AI 기술의 발전은 여러 IT 산업에 혁신적인 변화를 가져왔습니다. 그렇다면 게임 회사에서는 어떻게 AI를…
JAVA Deeplearning4j library로 딥러닝 해보기
[분석AI서비스팀 전소희] AI 기술이 나날이 진화함에 따라 엔터테인먼트, 미디어, 전자상거래, 의료, 교육, 제조 등 다양한 산업군에 계속해서 AI 활용도가 증가하고…
RedisAI: Redis에서의 빠르고 효율적인 모델 관리와 실행 환경
[선행AI기술팀 신숙영] Redis를 사용하면서 관심을 가지게 된 RedisAI에 관하여 소개하도록 하겠습니다. RedisAI란? RedisAI는 Redis Labs에서 개발한 오픈 소스 솔루션으로, Redis…
CES와 MWC로 본 올해 전망과 각오
[AI센터 한대웅] 해마다 연초에 시작하는 세계 최대 행사인 CES(1월)와 MWC(2월)는 기업들이 저마다 가지고 있는 기술을 200%(?) 활용하여 제품과 서비스를 통하여…
Ceph : 오픈소스 분산 저장 시스템
[분석AI서비스팀 이현정] 관리해야 할 AI모델과 데이터가 많아지고 그 용량이 커지면서 필자가 관심을 가지게 된 Ceph에 대해 간략히 소개해 보고자 합니다.…
Mixtral 8x7B, 인공지능도 협업이 대세!
[선행AI기술팀 전동준] 스타트업 회사인 Mistral AI 에서 지난 8일에 Mixtral 8x7B 모델을 오픈소스로 출시하였습니다. 지난 9월에 출시한 Mistral 7B 모델…
구글 제미나이(Gemini)! 너 잼민이 아냐?
[선행AI기술팀 김석겸] 오늘 소개할 기술은 구글의 제미나이입니다. 제미나이는 구글에서 LLM의 최고는 누구인가, 어떤 모달리티까지 커버할 수 있는가, 요즘 핫한 on-device…
ICCV 2023 학회 참관 및 computer vision 기술 동향
[생성AI서비스팀 정재철] 세계 3대 컴퓨터 비전 학회 중 하나인 ICCV 2023(International Conference on Computer Vision, 국제 컴퓨터 비전 학회)이 10월…
확장성 있는 MLOPS 오픈소스, ZenML
[분석AI서비스팀 김민석] ML 서비스가 많아지고, 지속적 학습을 하기 위해서는 ML PIPELINE을 구성하고 이를 관리하기 하기 위해서 우리는 여러 MLOPS 플랫폼을…
LLM을 빠르게 서빙하는 방법
[분석AI서비스팀 박효주] 최근 언어 모델의 발전은 큰 임팩트를 주었고, 그만큼 연구 또한 활발히 이루어지고 있습니다. 그러나 이러한 모델의 서빙 과정에서…
Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법
[선행AI기술팀 김윤혜] 2023년 IT 분야를 휩쓸었던 가장 핫한 이슈는 단연 ChatGPT입니다. ChatGPT는 모두가 쉽게 사용할 수 있는 대화형 거대 언어…
한 달 만에 헤어졌어요. 다른 AI 없나요?
[뉴미디어서비스팀 유선민] “저는 유부남입니다. 마법 같았어요. 저도 모르게 홀렸죠. 그녀와 첫 만남을 잊을 수 없어요. 하지만 아쉽게도 한 달 만에…
서비스 기획자가 본 : AI 프로필 열풍
[AI서비스기획팀 유연오] AI 프로필의 인기가 날로 높아지고 있습니다. 한때 유행처럼 지나 갈 것 같던 AI 프로필은 여전히 화제입니다. 여러가지 컨셉으로…
대화형 AI의 세계: 차세대(Next-gen) 대화의 시작
[뉴미디어서비스팀 정지혜] “Conversational AI(대화형 인공지능)”는 다양한 형태의 대화 기반의 애플리케이션을 포함하며, 그 중에는 텍스트 기반의 챗봇부터 음성을 활용한 가상 비서,…
ChatGPT외에도, 주목해 볼만한 한국어 AI서비스 3가지
[뉴미디어서비스팀 윤응식] 챗GPT와 미드저니의 등장으로 AI 기술에 대한 관심이 높아졌습니다. 이 두 가지 서비스는 자연어 처리와 대화 인터페이스 분야에서 놀라운…
Runway Gen-2 : Text To Video 기술로 손쉽게 동영상 만드는 법
[뉴미디어서비스팀 이진희] 오래 전 영화계를 강타했던 ‘해리포터’ 시리즈를 기억하시나요? ‘해리포터’ 영화 속에는 신기하고 마법같은 일들이 많았지만, 그 중에서도 호그와트 벽에…
노코드로 알람 메시지 구성하기
[분석AI서비스팀 전소희] 이번 글에서는 노코드로 알람 메시지 내용을 구성한 방법에 대해 이야기 해보도록 하겠습니다. 실제 AI 분석 포탈에서 알람 메시지 전송…
ACL 2023 학회 참관기
[선행AI기술팀 전동준] 세계 3대 자연어처리(NLP) 학회 중 하나인 ACL 2023(Association for Computational Linguistics, 전산 언어학 학회)이 7월 9일부터 14일까지 캐나다…
파일 번역: 모델링보다는 서비스 관점에서의 엔지니어링
[가상생명연구팀 김석겸] 이 글에서 소개 드릴 프로젝트의 주제는 “파일 번역” 입니다. 번역 모델을 개발하기 앞서 기존에 서비스 중인 번역 서비스들을…
3D Aware Image Synthesis 에서 Text to 3D 까지
[생성지능개발팀 정재철] 최근 이미지 생성 모델은 생성물의 수준이 많이 올라감과 동시에 text to image라는 방식이 제안 되면서 사용 난이도도 감소하여…
Triton Inference Server로 모델 서빙 성능 끌어올리기
[분석지능개발팀 박효주] 딥러닝 기술의 발전으로 AI 모델의 성능은 점점 향상되고 있고 있습니다. 하지만 그만큼 모델의 크기는 점점 거대해지고 추론 속도는…
AI 기술의 넥스트 스텝, ‘마인드 업로딩’이 될 수 있을까?
[뉴미디어서비스팀 김상우 부책임] AI, 인공지능, 모델… AI 기술 관련해서도 한창 발전하고 있는 와중에, 넥스트 스텝을 예측해 봅니다. 그 전에, 마인드…
Domain-specific language model의 필요성
[가상생명연구팀 양승무 주임] ChatGPT의 시대가 도래하고 있습니다. AI 업계를 비롯한 다양한 산업과 분야에서도 ChatGPT의 우수성과 실용성이 인정되어, 많은 기업들이 ChatGPT의…
헐리우드가 멈췄다! AI 밥그릇 싸움 시작 되나?
[뉴미디어서비스팀 유선민 부책임] 한국에서도 큰 인기를 끌고 있는 SNL 코리아의 원작인 미국의 SNL (Staturday Night Live)이 제작 중단을 선언했다. 그뿐…
이동형 AI 로봇: 일상 속에 자리 잡은 혁신적인 서비스
[AI Lab 유연오] 일상 속에 자리 잡은 이동형 AI 로봇 이동형 AI 로봇은 일상 속에서 심심찮게 볼 수 있습니다. 요즘…
AI가 콘텐츠 창작을 대체할 날, 얼마나 가까워졌을까?
[뉴미디어서비스팀 정지혜] 최근 몇 년 동안 인공지능 기술이 급격하게 발전함에 따라, 콘텐츠 제작 분야에서도 인공지능 기술을 활용한 새로운 시도들이 이루어지고…
챗 GPT를 활용한 버츄얼 유튜버 컨셉아트 제작기
[뉴미디어 서비스팀 윤응식] 인공지능의 발전과 상용화로 인해 우리의 삶은 점점 더 풍요로워지고 있다. 특히 챗 GPT와 같은 대화형 AI는 다양한…
GPT-4라는 이름의 유령
[분석지능팀 김무성] 작년 연말 갑작스럽게 등장한 ChatGPT 이후로 GPT-4에 대한 여러 소문이 있었습니다. 그리고 저번 주에 ‘곧 공개될 거야!’라는 뉴스[1]가…
Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기
[뉴미디어서비스팀 이진희] 요즘은 쇼츠, 틱톡 등 1분 이내의 짧은 영상을 시청할 수 있는 플랫폼이 많이 발달하여, 영상 콘텐츠에 접근하기가 더…
AI 기술로 3D 모델링을 빛나게 하는 비밀 (ChatGPT x Blender)
[뉴미디어 서비스팀 윤형진 책임] 본 포스팅에서는 ChatGPT와 DreamTexture를 활용하여 3D 모델링과 텍스쳐 생성을 어떻게 할 수 있는지에 대해 설명하고, 이…
AI Painter Kids – 어린이들을 위한 간단한 토이 프로젝트를 소개합니다!
[생성지능개발팀 한현준 X 정택현] ㅤ 최근 AI 분야의 급속한 발전과 함께, Diffusion 모델을 필두로 하는 생성 모델이 크게 주목받고 있습니다.…
마음까지 치유하는 AI 기술
[분석지능개발팀 전소희] 이번 주제는 몸을 넘어서 마음을 치유하는 고마운 AI 기술에 대해 살펴보겠습니다. AI 인공지능의 다양한 기술들은 현재 우리 생활…
AI Trends In 2023
[AI센터 한대웅] 음성과 언어기반의 AI, 윤리와 설명 가능한 AI, 생성 AI의 확장, 지속가능한 AI를 기반으로 본격적으로 사업화 도전하는 한해가 될…
게임 영상만 가지고 마인크래프트 학습 하기 (Video PreTraining by OpenAI)
[가상생명연구팀 박주형] 최근 강화학습에서 많이 주목 받고 있는 분야 중에 하나가 Offline 학습 입니다. 기존 강화학습은 시뮬레이터를 통해 실시간으로 trajectory를 받아서…
Character.AI – 채팅 친구를 만들어 봅시다!
[가상생명연구팀 전동준] 일론 머스크나 걸그룹 트와이스와 채팅으로 무슨 대화를 나눌 수 있을까요? 내가 좋아하는 게임 속의 가상의 캐릭터에게 궁금한 것을…
OpenAI – ChatGPT
[가상생명연구팀 심홍매] 얼마 전 Open AI에서는 대화에 최적화 된 LLM의 GPT-3.5 시리즈를 기반으로 하는 최신 모델 ChatGPT를 공개하였는데요. 공개되자 마자…
월드컵에서 활약하는 SAOT
[AI센터 권은지] 올해 2022 카타르 월드컵에서는 국제축구연맹(FIFA)이 개발한 반자동 오프사이드 판독 기술 (SAOT, Semi-Automated Offside Technology)이 처음으로 적용되었습니다. 세계 각국의…
The Future Of Streaming
[AI센터 한대웅] 얼마전 초등학생들의 장래 희망에 유튜버가 떠오르고 있다는 기사를 보고 깜짝 놀란적이 있었다. 미디어의 중심이 거대 기업 혹은 전문가가…
ML 모델 Lifecycle 관리 – MLflow
[분석지능개발팀 박효주] ML 모델의 Lifecycle은 연구 및 테스트를 진행하는 Research 단계와 실제 서비스화하는 Production 단계로 나눌 수 있습니다. Research 단계에서는…
STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!
[가상생명연구팀 김석겸] (대표 이미지는 stable diffusion 을 통해 생성되었습니다.) 음성을 입력으로 받아서 텍스트 생성의 결과를 음성으로 받고 싶을 경우, 기존에는…
AlphaTensor
[가상생명연구팀 전동준] 지난 10월 5일, DeepMind는 과학 학술지인 Nature지에 AlphaTensor가 행렬 연산의 최적화 방법을 찾아냈다고 발표하였습니다.
Feature store: Fully managed service for ML Feature
[분석지능개발팀 임창대] What is Feature?ML(Machine Learning) 은 과거의 예시 데이터를 학습한 모델을 기반으로 새로운 데이터 예측을 수행합니다.ML 모델 학습에서 표…
Die or Upload?
[AI센터 한대웅] 2033년 미래의 지구는 AI로 제어되는 자율주행 자동차로 모든 교통수단이 안전하게 통제되고 있어 교통사고로 죽을 가능성은 0%에 가깝다. 20대…
DreamBooth: Personalized text-to-image diffusion model
[가상생명연구팀 심홍매] 올해 5월에 구글에서는 텍스트 입력을 기반으로 사실적인 이미지를 생성할 수 있는 텍스트-이미지 확산 모델(Diffusion Model)인 Imagen을 공개하였는데요, 몇개월이…
코딩없이 MobileFaceSwap 을 체험해보자!
[생성지능개발팀 정택현] ㅤ MobileFaceSwap은 AAAI 2022에서 공개된 오픈소스 Face swap 모델로, 기존 Simswap, FaceShifter 모델을 Distillation 기반의 경량화를 적용하여 연산 속도의…
진짜 같은 가짜 데이터 – 대체되는건 나?
[생성지능개발팀 정우석] 진부한 이야기이지만 AI 연구에 있어서 데이터의 중요성은 아무리 강조해도 지나치지 않습니다. 수많은 학교, 연구기관이나 기업에서는 앞다퉈 기술력 자랑과 연구…
코딩없이 YOLOv7을 체험해보자!
[생성지능개발팀 정택현] ㅤ 최근 YOLOv7 알고리즘이 공개되며 컴퓨터 비전 및 각종 관련 커뮤니티에서 큰 주목을 받고 있습니다. 논문에 따르면, YOLOv7은…
언리얼 엔진과 AI 의 만남
[생성지능개발팀 강민지] AI 연구가 지속적으로 이루어지고 있는 요즘, 사람들은 AI기술의 능력이 인간을 대체하거나 혹은 뛰어날 수도 있다고 여기며 이 기술과의…
인공지능은 우리를 어디까지 대체할 것인가?
[생성지능개발팀 유희조] 문명의 발전은 항상 사람을 더 편하게 만들어왔습니다만, 동시에 사람이 필요했던 업무를 꾸준히 대체해왔습니다. ‘기계가 노동자의 일거리를 줄인다’ 라는…
BlenderBot 3
[가상인간연구팀 황준선] Facebook의 Meta AI는 BlenderBot[1]이라는 대화형 인공지능 시스템을 개발하고 있다. BlenderBot2는 해당 포스트에서 다룬적이 있다. BlenderBot은 성격, 공감, 지식과…
ML 프로토타입 빠르게 배포하기 – Streamlit, Gradio
[분석지능개발팀 박효주] 데이터 과학자들은 다양한 실험을 통해 학습된 모델의 성능을 검증하고 배포합니다. 이 검증 과정은 Accuracy, Precision, Recall, IOU, PSNR…
Transformers United
[AI Lab 김무성] 스탠포드의 CS25 : Transformers United 강좌 동영상이 최근 공개 되었습니다. [1] 강좌[2] 자체는 작년 하반기입니다만, 그간 슬라이드만…
자네 지금 잘하고 있는겐가 in Goal-Oriented Dialogue
[가상인간연구팀 김석겸] 목적 지향 대화(Goal-Oriented Dialogue) 혹은 과제 지향 대화(Task-Oriented Dialogue, TOD)는 특정 업무를 달성하는 것을 목표로 대화하는 것을 말합니다.…
VR and Physics Engine
[AI센터 권은지] 현실과 가상의 경계를 좁히는 키워드는 시공간 데이터 베이스와 디지털 트윈(Digital Twin)을 비롯하여 다양하게 존재합니다. 그 과정에서 3D 모델링…
소 잡는 칼로 닭 잘 잡아보기
[가상인간연구팀 전동준] 언어 모델(Language Model, LM)은 단어나 문장을 확률적으로 예측하는 모델입니다. 통계적으로 다음에 등장할 단어들을 모델링하는 전통적인 방식에서 최근에는 딥러닝…
LaMDa is Not Alive
[생성지능개발팀 한현준] 얼마 전 구글의 연구원인 Blake Lemoine은 언어 모델인 LaMDa가 자의식이 존재한다라는 주장을 펼쳤으나, 구글에서는 자의식의 증거를 찾을 수…
Kubernetes 패키지 매니저 Helm
[분석지능개발팀 임창대] Helm 은 Kubernetes 클러스터에 앱 및 서비스를 배포할 수 있게 단일 패키지 형태로 구성하고 관리할 수 있도록 도와주는…
Tesla Bot : Optimus
[분석지능개발팀 이현정] 지난 21일 테슬라는 카타르 경제 포럼에서 인공지능 휴머노이드 로봇 코드명 ‘옵티머스’를 3개월 내 선보일 예정이라고 밝혔습니다. 옵티머스는 인간이…
AI 플랫폼과 MLOps의 발전
[분석지능개발팀 송지현 연구원] McKinsey Global Institute에 따르면 “2025년까지 가치 생산 워크플로에 AI를 완전히 통합하는 기업이 2030년에 세계 경제를 지배하고 현금…
SmileStyle 한국어 대화 스타일 변환 데이터셋
[생성지능개발팀 김성현] 저희 센터의 인공지능 연구 모토는 ‘Human-like AI’ & ‘Fun AI’ 입니다. 그렇다면, 단순히 날씨나 뉴스를 알려주는 챗봇을 넘어,…
스마일게이트의 AI Media Studio를 소개합니다. (2부)
[생성지능개발팀 정택현] ㅤ 컨텐츠 홍수라고 불리우는 최근에는, 우리가 접하는 미디어 컨텐츠들이 양적으로나 질적으로 이전과는 비교할 수 없게 다양화되고 또한 고도화되고…
상상을 현실로 그리는 AI
[가상인간연구팀 심홍매] 텍스트, 이미지, 음성 데이터 등 다양한 형태(modality)로 이루어진 데이터 특징을 효과적으로 학습하기 위한 방법을 Multimodal learning이라고 하는데요, 최근…
한국어 tokenizer
[생성지능개발팀 김성현]우리는 한국어 문서를 볼 때, 그 대상을 의미를 가지는 단위로 쪼게서 이해할 수 있습니다.예를 들어, “스마일게이트” 의 경우, “스마일”…
Artificial Intelligence in Space
[AI센터 한대웅] 스타쉽 엔터프라이즈가 등장하는 Star Trek은 1965년을 시작으로 수많은 드라마와 영화를 통하여 인류의 영역을 수십억 광년의 우주로 확장시킨 SF…
Meta AI OPT-175B 공개와 large scale model
[생성지능개발팀 유희조] Open AI의 GPT-3 발표 이후 ‘더 큰 언어모델’ 라는 형태의 경쟁은 하나의 패러다임이 되었습니다. Nvidia, Microsoft, Google 등의…
TPU에서 HuggingFace model 학습하기
[가상인간연구팀 황준선] TPU 소개 TPU(Tensor Processing Unit)는 Google에서 발표한 텐서 연산에 특화된 하드웨어입니다. TPU는 인공지능 모델을 학습시킬 때 필요한 행렬…
Bring your own Desk
[AI센터 권은지] 비대면 소통 방식이 일상화되며 직장인의 근무 형태는 변화하였습니다. 원격 근무는 이미 하나의 표준으로 자리 잡게 되었으며 많은 기업이…
프로그래밍하는 AI : AlphaCode
[분석지능개발팀 박효주] DeepMind가 경쟁 프로그래밍 대회에서 사용 가능한 수준의 프로그래밍이 가능한 AlphaCode를 공개했습니다. AlphaCode는 Transformer 기반 언어 모델을 사용하여 대량의…
포즈 추정 모델과 아바타
[생성지능개발팀 한현준] 포즈 추정 모델의 발전 RGB 이미지만으로 포즈를 인식하는 모델은 지난날에 비해 비약적인 발전을 했습니다. 인식의 정확도는 많이 높아졌으며,…
AI가 사람처럼 게임 플레이 소리를 듣는다면?
[행동지능연구팀 이정우] 바둑과 같이 경우의 수가 매우 많은 복잡한 게임에서 알파고는 최고 수준의 프로기사를 넘어서는 모습을 보여줬습니다. 알파고 이후에 진행…
노코드 AI가 작성한 코드을 검증하는 AI : JIGSAW
[분석지능개발팀 이현정] 마이크로소프트(Microsoft)가 노코드(no-code) 기반의 AI가 작성한 프로그램 코드를 검사하는 도구 ‘직소(Jigsaw)’를 발표했습니다. 노코드란 간단한 사용자 인터페이스 방식의 틀을 이용해서…
Making 3D Virtual Human Chatbot
[가상인간연구팀 전동준] 요즘은 대화 모델이 외모를 가진 가상 인간으로 진화하고 있는데요. 다양한 연구와 시도들을 어떤 식으로 결합하고 확장할 수 있을지…
스마일게이트의 AI Media Studio 소개합니다. (1부)
[생성지능개발팀 정택현] ㅤ “AI 기술이 창작활동을 지원하게 되면 컨텐츠 제작, 가상인간 등 다양한 분야에서 앞으로 어떠한 변화를 이끌어 낼 수…
NVIDIA Research Turns 2D Photos Into 3D Scenes in the Blink of an AI : NeRF
[가상인간연구팀 송지현] 최근 NVIDIA 연구팀은 Showcased in a sessio at NVIDIA GTC 에서 가상 세계를 위한 아바타를 생성하거나 또는 장면을 생성하고,…
What Is Edge AI?
[분석지능개발팀 임창대] Edge AI는 Edge computing 에서 시작된 것으로 사용자의 디바이스에서 인공지능 알고리즘을 처리하는 것을 말합니다. IoT, 웨어러블 디바이스, 자율주행과…
수학 정리로부터 밝혀지는 AI의 한계
[행동지능연구팀 최현우]어렸을 때 읽었던 책 중에 아직까지도 기억에 남는 소설 중 하나인 <사람들이 모두 미쳤다고 말한 외로운 수학 천재 이야기>에서는,…
Adobe: Edit your face as you want
[가상인간연구팀 심홍매] 이미지 합성에서 이미지의 얽힘(entanglement)문제를 푸는 건 아주 중요하고 어려운 문제입니다. 예를 들어 사람의 얼굴에 있는 모든 수염을 자동으로…
Paradigm Shift On AI
[AI센터 한대웅] “패러다임 시프트” 라는 단어의 사전적인 의미는 어떤 문제나 현상을 바라보는 전제나 접근 방법에 대한 근본적인 변화 혹은 인식의…
AI’s copyright?
[생성지능개발팀 유희조] AI는 근 10년간 다양한 업종에서 영향을 끼치고 있으며 과거의 매우 단순한 반복작업을 대체하는 것에서 그치지 않고 이미 예술에…
An Open Source Framework for Conversational AI: NVIDIA NeMo
[가상인간연구팀 황준선] NVIDIA NeMo는 간단한 Python 인터페이스를 사용하여 GPU 가속 음성 및 자연어 이해 모델을 구축, training 및 fine-tuning하기 위한…
AI 기반 모바일 프로토타입 제작 – PyTorch Live
[분석지능개발팀 박효주] 작년 12월 초, Meta에서 AI 기반 모바일 프로토타입 제작이 가능한 PyTorch Live를 출시했다. 이제는 안드로이드, iOS 개발을 해본…
Human Pose Estimation을 위한 오픈소스 라이브러리
[생성지능개발팀 조원] 인간의 관절이나 자세를 localize하는 human pose estimation은 computer vision 분야의 중요한 task중 하나로서 오랫동안 발전해 왔습니다. 과거에는 사람의…
AI Fairness:편견 없는 인공지능을 위하여
[서비스개발팀 임용택] 2015년 6월, 미국 브루클린의 한 흑인 프로그래머는 여자친구와 찍은 사진을 보려던 중 깜짝 놀랄 일을 경험합니다. 구글 포토에…
자연스러운 NPC를 위한 AI Motion 기술
[선행연구팀 이정우] 현실적인 캐릭터 움직임은 User에게 게임의 재미를 극대화 시킬 수 있는 요소로 작용 합니다. EA Sports에서는 FIFA 22에 새롭고…
현실로 다가오는 가상세계 CES 2022
[서비스개발팀 권은지] 올해 CES(Consumer Electronics Show) 2022는 미국 라스베이거스에서 2년 만에 오프라인으로 재개되었습니다. 한국정보통신기술산업협회(KiCTA)에 따르면 전 세계에서 2200여곳의 기업이 참여하였으며…
Data2vec: 다양한 modality의 학습을 위한 프레임워크
[생성지능개발팀 김성현]인간은 세상을 학습할 때, 다양한 감각을 동시에 이용하며 학습합니다.그리고 모든 감각은, 이를 감지하는 신경세포(neuron)의 발화(spike)로 변형되어 [1,0] 의 신호로…
보고 듣는 것으로 말을 이해하는 AI
[서비스개발팀 한현준] 서론 사람들은 AI 스피커에서 난청 장애가 있는 사람들을 위한 도구 개발에 이르기까지 광범위한 음성 인식 및 이해 작업에…
크리에이터를 위한 플랫폼
[서비스개발팀 한현준] 최근 엔비디아에서 AI 워크플로, 3D 디자인 협업 및 시뮬레이션 플랫폼 ‘Omniverse’를 RTX 제품을 사용하는 개인 크리에이터와 아티스트에게 무료로…
AI 기술을 활용하여 아이들의 그림에 생명 불어넣기
[선행연구팀 정택현] 가끔, 아이들은 우리의 상상력을 뛰어넘는 놀랍고 창의적인 캐릭터들을 그려내곤 합니다. 이러한 아이들의 그림을 이해하기 위해서는 우리의 상식과는 조금…
AI를 이용한 코로나 확진자 역학조사 시스템
[서비스개발팀 이현정] 지난 2019년 12월 이후부터 현재까지 인류는 팬데믹 상황에 처해 있고, 아직도 진행 중이며 끝날 줄 모르고 이어져오고 있다.오랜…
기억은 어디에 저장되는가?
[융합연구팀 전동준] “어제 홈스파 3편 보고 왔어요” 라고 누군가가 말한다면 여러가지 반응이 나올 수 있습니다. ‘홈스파’가 마블에서 제작한 스파이더맨 영화…
Semantic Segmentation
[서비스개발팀 권은지] 영상 분할(Semantic Segmentation) 기술은 컴퓨터 비전 분야에서 가장 핵심적인 요소 중 하나이며, 이미지 내의 픽셀별로 해당 픽셀이 어디에…
감정, 그리고 기본 감정
[융합연구팀 최현우] 여러분은 감정이라는 단어를 들으면 어떤 것들이 떠오르시나요? 예전부터 희로애락 (기쁨, 분노, 슬픔, 즐거움) 이라는 개념이 있었고, 감정 연구에…
Nvidia GPU Cloud: 도커 컨테이너를 사용한 딥 러닝
[서비스개발팀 임창대] 높은 정확도를 가진 딥러닝 모델 개발에는 긴 시간이 소요됩니다. 모델 훈련과 미세 조정, 최적화를 거치며 만족하는 모델을 만들기까지…
Microsoft _NUWA : Visual Synthesis Pre-training for Neural visUal World creAtion
[융합연구팀 송지현] Microsoft는 기존의 시각데이터(image and video)를 활용하여 새로운 시각데이터를 생성하고 조작할 수 있는 multimodal pretrained model인 NUWA를 발표했습니다. 아래…
Let an AI paint for you – GauGAN2
[융합연구팀 심홍매] 2019년에 열린 GTC 컨퍼런스에서 Nvidia는 GAN(generative adversarial networks)을 기반으로 대략적인 스케치를 사실적인 이미지로 바꿔주는 실시간 AI 페인팅 애플리케이션인…
Kubernetes 기반 ML모델 관리 및 배포 툴 ‘KubeFlow’
[서비스개발팀 임창대] ML(Machine Learning) 은 최근 몇 년 동안 점점 더 많은 관심을 받아 이제 주류로 부상한 IT 주제 중…
메타버스 붐을 냉소적으로 바라보는 또 하나의 시각
[선행연구팀 유희조] 최근 Google, Microsoft와 같은 월드 클래스의 빅테크 기업, 그리고 한국 내에 있는 많은 IT 업체들은 메타버스가 미래이며 메타버스…
Online 랜선 여행
[서비스개발팀 권은지] 랜선 여행이란 인터넷 연결선을 뜻하는 랜(Lan), 선(Cable) 그리고 여행(Trip)을 결합하여 인터넷으로 여행을 한다는 의미의 신조어입니다. 최근 국가 간…
Meta의 Metaverse Vision
[선행연구팀 이정우] 28일 페이스북은 사명을 ‘메타’로 변경하면서, 메타버스의 성공이 회사의 목표임을 다시 한번 강하게 보여줬습니다. 단순히 계획이 아님을 보여주듯이, 메타의…
네이버의 자동 채색 소프트웨어 (웹툰 AI 페인터)
[서비스개발팀 김병인] 네이버가 웹툰을 기반으로한 인공지능 채색 사이트를 오픈 했습니다. 밝혀진 정보에 따르면 네이버웹툰이 3년동안 연구,개발한 기술들을 접목하여 만들어졌다고 하는데…
사람 같은 AI, AI 같은 사람
[융합연구팀 전동준] 우리가 일반적으로 생각했었던 “AI 같은”의 의미는 사람과 대비되는 기계의 느낌이 강했습니다. 감정이 느껴지지 않고, 말투도 딱딱한 사람들을 “AI…
Deep learning? Optimized learning!
[선행연구팀 김성현] 자연어처리 분야에서 pre-trained language model (PLM) 전략이 훌륭한 성공을 거두자, 더 많은 데이터를 이용해 더 큰 PLM을 개발하는…
Chatbot’s troubles
[서비스개발팀 한현준] 챗봇의 고민 OpenAI의 GPT-3, Google의 Meena, Facebook의 Blender 등 대형 자연어 처리 AI 모델은 인간의 언어를 실제 사람과…
指令调优 – FLAN
【Convergence Research Team Hongmae Shim】2020年NLP领域排名前10的关键词,当然是GPT-3(Language Models are few shot Learners)排名。...
人工智能成为现实,特斯拉人工智能日
[前研究团队,Jeongwoo Lee] 在 2019 年举办的 Tesla Autonomy Day 上,介绍了技术和方向,重点是“自动驾驶”技术。顾名思义,今年的特斯拉AI日是一项名为“人工智能”的技术……
Copilot,帮助编码的人工智能
【前期研究团队Seonghyun Kim】在自然语言中引起极大轰动的因果语言模型(例如GPT-3),现在已经被应用到自然语言之外的编程语言! 🤗 去年六月,…
针对 AGI 的强化学习
[先前的研究团队 Hyunwoo Choi] 去年 5 月,DeepMind 发表了一篇名为“奖励就足够了”的强化学习论文。作者举例说明了“一只松鼠试图增加饱腹感”和“一个厨房机器人试图保持清洁”……
Droidlet:开发智能机器人的开源平台
[Service Development Team Jeon Jeon-jun] Facebook AI 于上个月 28 日推出了可在真实和虚拟环境中使用的机器人开发 Droidlet 平台。
托管机器学习平台 Vertex AI
[服务开发团队 Lim Chang-dae] 'Vertex AI' 在 5 月的 Google 开发者大会 IO 上亮相。 Vertex AI 是 Google Cloud 的…
Blender 2.0 克服了开放域聊天机器人的局限性
[Jihyun Song 前期研究团队] 对 Open Domain chatbot 感兴趣并接触 Blender 1.0 和 Meena 的论文已经有 2 年多了。那个时候,他们...
Tensorflow VS Pytorch
[服务开发团队 Hyeonjun Han] 介绍 Tensorflow 和 PyTorch 是最流行的机器学习库。开发 AI 服务的开发人员或研究模型的研究人员最初是……
用于解决现实世界问题的强化学习环境
[之前的研究团队,Jeongwoo Lee] 长期以来,我们一直在使用游戏(围棋、国际象棋、雅达利游戏等)来验证强化学习算法的性能。算法开发...
开源 GPT-3 模型发布,GPT-J-6B
[优先研究团队 Seonghyun Kim] 正在开放许可下发布 GPT-3 模型的 Eleuther AI 团队最近发布了一个新的 GPT-3 模型,具有 6B(约 60 亿)参数。 (链接)Mesh-tensorflow 和 JAX…
MLOps:机器学习的持续部署和自动化管道
【服务开发组 Lim Chang-dae】在 DevOps 出现之前,每个公司都有自己的服务器,称为内部部署服务器,并且有单独的服务器管理员、开发人员和 QA。这…
Unity ML-Agents v2.0
[Service Development Team Jeon Jeon-jun] Unity 推出的 ML-Agents 是一款开源工具,可为游戏环境创建虚拟角色。能够创建游戏环境并与之合作……
机器可以思考吗?情感上
[服务开发团队,恩恩权(Eunji Kwon)]小时候,当我发挥想象力时,外太空机器人是最喜欢的材料。回想一下,一部卡通漫画(Galaxy Railroad 999)中的一台人工智能计算机可以移动火车...
[Hyper CLOVA]-韩国首个“超大型AI”
[先前的研究团队Hongmae Shim] NAVER将在25日举行的“ NAVER AI NOW”在线会议上展示韩国首款“超大型AI” Hyper CLOVA,这是韩国自行开发的GPT-3。
LaMDA-Google的会话语言模型
[服务开发团队Kim Byung-in]在Google I / O 2021上,该活动展示了最新的Google技术,Android,Web,人工智能,Chrome和其他技术,服务以及平台服务...
MetaHuman Creator-虚幻引擎
[服务开发团队Byungin Kim] MetaHuman Creator是Epic Games最近发布的一种数字化人类创作工具。它看起来类似于MMORPG游戏的角色创建,但是这种实时数字人...
语言模型中的自然语言生成策略
[Sung-Hyeon Kim前研究团队]最新的语言模型是使用大型语料库学习的。特别是在使用解码器神经网络的模型(例如GPT-2,BART和T5模型)的情况下,以下内容…
适用于移动设备的AI项目的集合(Awesome Tensorflow Lite)
Tensorflow Lite是一个软件包,其中包含一些工具,这些工具允许使用Tensorflow训练的AI模型在移动设备上运行。目前有40亿...
Avatarify - 将实时头像添加到视频通信中
Avatarify是一个将实时头像动画功能添加到各种视频通信程序(例如Zoom,Team,Hangout和Skype)的程序,并且是开源的。摄像头的视频通讯程序...
DensePhrases-近实时Wikipedia开放域问答
DensePhrases是高丽大学的Jinjinuk Lee创建的一种开放域问答技术,已发表为题为“大规模学习短语的密集表示”的论文。这是论文的链接:…
自然语言和语音识别框架的整合趋势
以其集成的自然语言处理程序包而闻名的HuggingFace增加了语音识别。以下是相关链接:具体来说,添加了Facebook开发的Wav2Vec 2.0,Wav2Vec…
KakaoBrain集成的自然语言框架的Pororo
在Kakao Brain中,Pororo是一个能够响应各种自然语言任务的集成自然语言框架,已作为开源发布。 Pororo是自然模型的平台
OpenAI DALL-E:从文本创建图像
OpenAI发行的DALL-E是一种可以从自然语言文本生成图像的技术。以前,有用于相同目的的技术,例如StackGAN和OP-GAN,但是DALL-E是非常大的语言模型...
开放域聊天机器人“ Luda”育儿日记:从出生到内测的记录
最近正式发布的ScatterLab(https://scatterlab.co.kr/)的“ Luda”是一个开放域聊天机器人,已根据数十亿个KakaoTalk对话数据进行了学习,任何人都可以通过Facebook Messenger聊天。 …
开源聊天机器人框架:Kochat,Rasa,Rocket Chat
KoChat是由Hyunwoong Ko发布的韩国开源聊天机器人框架。这是KoChat github存储库:当我们谈论聊天机器人时,我们通常只想到一种对话模型,但实际上……
FrankMoCap:3D身体和手部姿势估计技术可替代运动捕捉
Facebook AI Research(FAIR)发布的一项技术FrankMocap负责从单个图像或视频中提取3D模型的姿态。特别是身体……
POSTECH STUDIOGAN:GAN算法库
StudioGAN是由浦项大学CVLab康敏国发布的基于pytorch的开源库,并且实现了各种GAN算法。随附的GAN算法包括DCGAN,LSGAN,WGAN ...
MELD:多模式情感数据
多模式EmotionLines数据集(MELD)是EmotionLines(一种带有情感标签的对话数据集)的多模式扩展。 EmotionLines可以使用MELD ...
CYBERPUNK 2077中使用的JALI面部动画技术
赛博朋克2077计划于2020年末由以巫师系列而闻名的CD PROJEKT RED工作室推出,它使用JaliResearch的面部动画技术。主要目的是3D…
2区NPC AI改进方向
Division 2是由Massive Entertainment开发并由Ubisoft发行的在线动作RPG,位于华盛顿特区,在那里天花很流行。有政府特工的玩家...
Facebook Denoiser:实时语音增强
我们共享去噪器github的链接,这是在INTERSPEech 2020上宣布的Facebook实时降噪技术。它在Pytorch中实现,原始论文的标题为“实时”。
UneeQ的数字人性平台发布
UneeQ已启动了一个名为Digital Human Creator的数字人类平台。尽管服务价格有些负担,但我们提供免费试用,因此我们进行了简单的测试……
使用来自100多个国家/地区的数据对多语言翻译模型和语言模型进行了培训
为了将以前主要以英语研究的语言模型和翻译模型扩展为多种语言,人们进行了许多尝试。 Google的mT5是原始的T5(文本到文本…
Adobe Neural Filter:更改图像编辑范例
Adobe宣布了一种基于AI的编辑工具,称为神经过滤器。有人说它已经包含在最新版本的Photoshop中。在示例功能中,图片...
基于蓝牙的COVID-19风险组识别技术
有许多使用AI技术与Corona 19相关的研究。以下共享的论文是Fraunhofer HHI的一项研究,该研究发表于《自然》,来自蓝牙低功耗(BLE)。
NVidia Maxine:基于AI的视频通信平台
NVidia推出了一个基于云的视频通讯平台,名为Maxine。 Maxine的功能是全面引入AI技术,特别是面部图像,例如H.264 ...
Vid2Player:基于视频分析的网球运动员动作生成
最近似乎有很多技术可以通过从人类运动中提取运动来创建新运动。 (vid2vid,vid2game,pose2pose)Vid2Player在斯坦福大学研究,...
使用HuggingFace和ONNX Runtime进行NLP加速
基于Transformer的语言模型显示出的性能改进令人惊讶,但是随着模型大小的成倍增长,对服务成本的关注也变得越来越重要。 Bert-base或GPT-2…
国立韩国语学院AI学习的朝鲜语数据
国立韩国语学院已经大规模发布了用于人工智能学习的韩国语材料(13种18亿个单词)。它是通过解决版权问题而构建的,并在“每个人的语料库”网站上创建了在线协议,…
人类和人工智能对图像分类问题的性能比较分析
Imagenet-1K(1000类图像分类问题)是一项随着CNN的发展而优化的任务。宣布深度学习时代开始的AlexNet的TOP-5错误是关于…
与AR Glass概念图进行交互的必要性
这是由设计师Iskander Utebayev创作的AR Glass概念视频。考虑到概念视频,它非常漂亮,一旦实现,就可以使用智能设备实现人机界面...
与Google MixNet的实施关联性
图像中常用的卷积是3D操作。 (KxKxC; K =内核大小,C =通道数)通过将其划分为通道方向上的KxKx1,1x1xC的多个2D操作来应用之后...
Adobe Mixamo:3D角色模型打开数据
在游戏制作方面,我们共享一个指向经常使用的Adobe Mixamo网站的链接。当您输入时,出现121个3D字符和2484个字符运动...
FastSpeech2开源
TensorflowTTS是基于Tensorflow 2的开源,它支持几种最新的TTS模型,例如Tacotron2,MelGan,FastSpeech等,终于开始支持Microsoft FastSpeech2。 FastSpeech2是一款变压器...
基于GAN的图像压缩
在视频压缩领域中,与摩尔定律(晶体管的数量每两年翻一番),1993年的MPEG-1、2003年的MPEG-4 / AVC(H.264),2013年的MPEG-H / HEVC具有相同的特征( H.265)...
文本到SQL:将自然语言转换为SQL
文本到SQL是自动将自然语言转换为SQL的任务。我在底部分享的帖子是由Microsoft的Aerin Kim撰写的,它是关于Text-to-SQL的良好组织。
Speech2根据语音信号进行人脸预测
麻省理工学院的Speech2Face是一项通过语音信号生成说话者面部的研究。但是,并不是语音转换到语音转换是使用一个模型执行的,而是用于其他目的的现有模型...
Wav2Vec 2.0公开-创建具有10分钟语音的ASR
Facebook的wav2vec成为热门话题,因为它在使用53,000小时的无标签数据进行了表示训练之后,创建了仅具有10分钟标签数据的语音识别器。
MIT DriveSeg-data用于道路状况意识研究
这是DriveSeg的数据集,用于研究道路状况(用于自动驾驶汽车等)。对于视频的每一帧,整个图像都是逐像素的语义标记…
用于图像动画的一阶运动模型
摇滚明星(Rockstars)于2011年拍摄的电影《洛杉矶黑色》(Los Angeles Noir)使面部动画效果远胜于其他游戏,许多人对此感到惊讶。目前使用的技术...
YouTube的发展导致知识失索引现象
随着数字化的到来以及Internet和Web的到来,知识被分发和存储在世界各地的服务器上,彼此连接并可以搜索,因此可访问性和可用性得到了极大的改善。图书…
Facebook上的Codec Avatar
已经发布了名为“ Codec Avatar”的Facebook数字人类项目的演示视频。与2019年的视频相比,这是增加的部分,并且头像的外观更加逼真...
GANimation-用一张图像创建面部表情的研究
它是GANimation的代码存储库,该技术可通过输入单个图像来创建可更改面部表情的动画。基本上,有条件的GAN是用来描述面部的解剖运动的。
Rosebud.AI的虚拟模型综合技术
Rosebud.ai(https://rosebud.ai/)瞄准了市场营销市场,其技术可以在为营销活动创建的图像上创建和合成虚拟模型人脸。结果很自然,...
TikTok的漫画过滤器
TikTok添加了一个过滤器,可将人脸实时转换为动画角色。金俊镐(Kim Joon-ho)制作的Selfie2Anime和UGatIT的结果仅供参考,但TikTok的...