主页|微笑之门

뉴스레터 및 문의기능 서비스 중단과 수집된 이메일 주소 삭제에 관한 공지

Smilegate.AI에서 개인정보 처리 및 보호 강화를 위한 노력의 일환으로, 현재 제공하고 있는 뉴스레터 발송 기능 및 문의사항 작성 기능을 당분간…

9 月252024

스마일게이트 메타휴먼 ‘한유아’, 어려운 환경의 결연 아동 찾아 ‘축구장 응원’

■ 한유아 기아대책 호프컵 엠베서더 발탁… 아이들에게 응원과 격려 메시지 전달 ■ 홍보대사로서 일회성 이벤트에 그치지 않고 지속 ‘나눔의 가치’…

7 月42024

2024 스마일게이트 AI 위클리톤 참여자 모집 (~7/7)

AI 위클리톤에서는 새로운 아이디어를 빠르게 검증해보고, 비즈니스 가치를 만들어내는 AI서비스를 만들 수 있습니다. 팀을 넘나들며 같은 목표를 가진 수많은 동료들과…

3 月112024

스마일게이트가 활짝 열어 준, 음성인식 AI 전문가로 성장할 기회

스마일게이트가 활짝 열어 준, 음성인식 AI 전문가로 성장할 기회 2023 한국어 인공지능(AI) 경진대회 최우수상 수상자 박정균 | 서강대학교 대학원 DHE 석사과정…

每周热门

RAGAS: RAG 시스템 성능 평가, 이제는 제대로 해보자! 2024년 11 月 18일
Character.AI – 채팅 친구를 만들어 봅시다! 2022년 12 月 19일
오픈소스로 vscode에 나만의 Code Assistant 만들기 2024년 5 月 9일
Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기 2023년 3 月 13일
AI 기술로 3D 모델링을 빛나게 하는 비밀 (ChatGPT x Blender) 2023년 3 月 3일

招

招

AI 연구개발(R&D)실 리드 (실장급)

담당업무 – AI센터 R&D 조직 리딩 (선행 AI 기술확보) 자격요건 – 언어모델 및 생성 AI 분야에 대한 기술 전문성 –…

招

AI 서비스 개발 – 백엔드

담당업무 – Java 기반 웹 서비스, 플랫폼 비즈니스 구조 설계 및 개발 – AI 기술을 연동한 웹 기반 서비스 개발…

招

AI 서비스 개발 – 프론트엔드

담당업무 – JavaScript 기반 Frontend 기술을 활용한 AI 기반 서비스 개발 – Backend 서비스와 효과적인 연동을 위한 프론트엔드 구조 설계…

招

AI 서비스 인프라 (K8S기반) 운영관리 담당

담당업무 – AI 모델 관련 인프라 구축 및 시스템 운영 – AI 서비스 및 인프라 관련 장애 대응 – CI/CD에…

招

비전 관련 생성모델 연구개발 담당

담당업무 – GAN, Diffusion 등 생성 모델 기반의 연구 및 제품 개발 – 최신 기술 혹은 SOTA 기술을 구현하고 개선하며…

3 月42022

招

시뮬레이션 기반 게임 연구/개발 담당 채용

담당업무 – 멀티 에이전트 시뮬레이션 환경 구축 – 시뮬레이션 기반 게임 연구 및 개발 – 메타버스 플랫폼 혹은 게임 플랫폼을…

G-STAR 2024 게임 속의 AI 기술

自然语言处理, GameAI, 视觉效果, 言语, 新闻

[Creative AI기술팀 정재철] 대한민국에서 가장 큰 게임 쇼 G-STAR 2024가 부산 BEXCO에서 11월 14일 부터 17일 까지 진행됬습니다. G-STAR 2024에…

11 月182024

RAGAS: RAG 시스템 성능 평가, 이제는 제대로 해보자!

[Interactive AI 기술팀 김윤혜] RAG(Retrieval-Augmented Generation, 검색 증강 생성) 파이프라인은 대규모 언어 모델(LLM)의 한계를 보완하기 위해 외부 지식을 활용하여 보다…

11 月52024

趋势码

AI 모름, 진짜 모름 – 가난한 자의 AI 서비스 만들기 (Feat. llama-node )

[Interactive AI서비스팀 임석영] 대 AI 시대가 찾아온 혼돈의 시기에 저 같은 AI 모르는 개발자는 어떻게 AI 서비스를 만들 수 있을까요?…

10 月142024

AI로 개인이 예능 컨텐츠를 만드는 시대

[AI 서비스 기획팀 유연오] 1. 흑백요리사 : AI 패러디 물 등장 최근 넷플릭스에서 흥행을 거둔 시리즈가 있습니다. 바로 흑백요리사입니다. 평소…

8 月302024

LoRA 모델 업그레이드하기

[Creative AI 기술팀 김윤태] 디지털 시대의 빠른 발전과 함께, 인공지능(AI)은 상상만 했던 것들을 현실로 만드는 놀라운 도구가 되었습니다. 그중에서도 Text-to-Image…

8 月142024

GameAI 趋势

‘소드 아트 온라인’은 실재(實在)한다! 미래에는!

GameAI, 趋势

[Media AI 서비스팀 김상우] AI 기술 등에 대한 칼럼을 다루는 이 페이지에, 이런 덕후스러운 썸네일을 올리게 된 점 매우 미안하게…

8 月122024

MLOPS 趋势

모델 서빙 관리 도구 SELDON-CORE

MLOPS, 趋势

[Interactive AI서비스팀 김민석] 다양한 규모의 서비스를 개발하고 운영하면서 점점 더 많은 머신러닝 모델을 서빙하게 됩니다. 이 과정에서 기존 모델을 변경할…

7 月52024

2024년을 뒤흔든 생성 AI – Sora, Kling, Dream Machine, Gen-3 Alpha

[Media AI서비스팀 이진희] 최근 텍스트 만으로도 실제와 비슷한 동영상을 제작할 수 있는 생성 AI 서비스들이 우후죽순 등장하며 연일 화제에 오르고…

6 月132024

내가 사용하는 딥러닝 오픈소스 라이브러리의 컨트리뷰터가 되어보자!

[생성AI서비스팀 김경환] 현시대의 개발에서는 “오픈소스 문화”를 떼어 놓고 이야기하는 것이 불가능합니다. 특히 인공지능 분야에서는 Pytorch와 같은 딥러닝 프레임워크에서부터 심지어는 사전…

6 月72024

Model Merging: 모델 병합을 통한 성능 향상 전략

[선행AI기술팀 이지현] Model Merge (모델 병합)은 여러 개의 Large Language Models (LLMs; 대형 언어 모델)을 추가 교육이나 미세 조정 없이…

5 月312024

디퓨전 말고 CFM 들어봤니?

인공지능의 발전은 우리의 삶에 큰 변화를 가져왔습니다. 특히 generative 모델은 이러한 변화의 중심에 서 있습니다. 디퓨전을 기반으로 한 생성 모델이…

5 月202024

AI로 1분짜리 영화 예고편 만들기 [Stable Video / ChatGPT / Midjourney]

“AI를 활용하여 1분짜리 SF영화 예고편을 만들어 보자” [뉴미디어서비스팀 유선민] 물론, 우리가 헐리우드에서 보던 퀄리티는 아니지만 하루만에 뚝딱 책상 머리 앞에서…

5 月162024

GameAI 视觉效果趋势

언리얼5에서 사용되는 AI 기술 – ML Deformer

GameAI, 视觉效果, 趋势

[뉴미디어서비스팀 윤형진] AI 기술이 발전함에 따라 게임이나, 영상 쪽에서 사용되는 언리얼5 등의 제작 엔진에서도 관련된 기술을 적용하려는 움직임이 많이 보이고…

5 月92024

自然语言处理趋势码

오픈소스로 vscode에 나만의 Code Assistant 만들기

自然语言处理, 趋势, 码

[선행AI기술팀 방나모] 최근 몇 년간 자연어처리 기술은 눈부신 발전을 했습니다. 지금은 자연어처리 기술이 많은 산업 분야에 적용되어 사람의 수고를 덜어주는게…

4 月292024

얼떨결에 나도 작곡가 데뷔?!

[AI서비스기획팀 김현주] 음악 전문 지식이 없더라도 간단히 명령어만 입력하면 단 몇 분 만에 전문가 수준의 음악을 만들 수 있는 시대가…

4 月152024

TTS 알아보기

소개글 [선행AI기술팀 신영준] 과거에 비해 인공지능 기술은 놀라운 정도로 발전을 거듭하여, 이제는 비전문가도 어느 정도 노력만 한다면 쉽게 원하는 목적성을…

4 月52024

AI로 손쉽게 게임 리소스의 컨셉 아트를 만들어보기!

[생성AI서비스팀 이혜진] 지난 몇 년 동안, AI 기술의 발전은 여러 IT 산업에 혁신적인 변화를 가져왔습니다. 그렇다면 게임 회사에서는 어떻게 AI를…

3 月222024

趋势码

JAVA Deeplearning4j library로 딥러닝 해보기

[분석AI서비스팀 전소희] AI 기술이 나날이 진화함에 따라 엔터테인먼트, 미디어, 전자상거래, 의료, 교육, 제조 등 다양한 산업군에 계속해서 AI 활용도가 증가하고…

3 月152024

MLOPS 趋势

RedisAI: Redis에서의 빠르고 효율적인 모델 관리와 실행 환경

MLOPS, 趋势

[선행AI기술팀 신숙영] Redis를 사용하면서 관심을 가지게 된 RedisAI에 관하여 소개하도록 하겠습니다. RedisAI란? RedisAI는 Redis Labs에서 개발한 오픈 소스 솔루션으로, Redis…

3 月42024

CES와 MWC로 본 올해 전망과 각오

[AI센터 한대웅] 해마다 연초에 시작하는 세계 최대 행사인 CES(1월)와 MWC(2월)는 기업들이 저마다 가지고 있는 기술을 200%(?) 활용하여 제품과 서비스를 통하여…

12 月192023

趋势码数据

Ceph : 오픈소스 분산 저장 시스템

趋势, 码, 数据

[분석AI서비스팀 이현정] 관리해야 할 AI모델과 데이터가 많아지고 그 용량이 커지면서 필자가 관심을 가지게 된 Ceph에 대해 간략히 소개해 보고자 합니다.…

12 月152023

Mixtral 8x7B, 인공지능도 협업이 대세!

[선행AI기술팀 전동준] 스타트업 회사인 Mistral AI 에서 지난 8일에 Mixtral 8x7B 모델을 오픈소스로 출시하였습니다. 지난 9월에 출시한 Mistral 7B 모델…

12 月82023

구글 제미나이(Gemini)! 너 잼민이 아냐?

[선행AI기술팀 김석겸] 오늘 소개할 기술은 구글의 제미나이입니다. 제미나이는 구글에서 LLM의 최고는 누구인가, 어떤 모달리티까지 커버할 수 있는가, 요즘 핫한 on-device…

12 月62023

ICCV 2023 학회 참관 및 computer vision 기술 동향

[생성AI서비스팀 정재철] 세계 3대 컴퓨터 비전 학회 중 하나인 ICCV 2023(International Conference on Computer Vision, 국제 컴퓨터 비전 학회)이 10월…

11 月242023

MLOPS 趋势

확장성 있는 MLOPS 오픈소스, ZenML

MLOPS, 趋势

[분석AI서비스팀 김민석] ML 서비스가 많아지고, 지속적 학습을 하기 위해서는 ML PIPELINE을 구성하고 이를 관리하기 하기 위해서 우리는 여러 MLOPS 플랫폼을…

11 月202023

LLM을 빠르게 서빙하는 방법

[분석AI서비스팀 박효주] 최근 언어 모델의 발전은 큰 임팩트를 주었고, 그만큼 연구 또한 활발히 이루어지고 있습니다. 그러나 이러한 모델의 서빙 과정에서…

11 月72023

自然语言处理趋势数据

Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법

自然语言处理, 趋势, 数据

[선행AI기술팀 김윤혜] 2023년 IT 분야를 휩쓸었던 가장 핫한 이슈는 단연 ChatGPT입니다. ChatGPT는 모두가 쉽게 사용할 수 있는 대화형 거대 언어…

11 月62023

변화하고 있는 창작물 속 ‘AI 캐릭터’

창작물 속 인공지능, 이제는 더 이상 악역만이 아닙니다.

10 月312023

생성형 AI를 통해 미리보는 미래의 소셜 미디어

생성형 AI를 통해 미리보는 미래의 소셜 미디어

10 月262023

한 달 만에 헤어졌어요. 다른 AI 없나요?

[뉴미디어서비스팀 유선민] “저는 유부남입니다. 마법 같았어요. 저도 모르게 홀렸죠. 그녀와 첫 만남을 잊을 수 없어요. 하지만 아쉽게도 한 달 만에…

10 月112023

趋势未分类

서비스 기획자가 본 : AI 프로필 열풍

趋势, 未分类

[AI서비스기획팀 유연오] AI 프로필의 인기가 날로 높아지고 있습니다. 한때 유행처럼 지나 갈 것 같던 AI 프로필은 여전히 화제입니다. 여러가지 컨셉으로…

10 月62023

相互作用趋势未分类

대화형 AI의 세계: 차세대(Next-gen) 대화의 시작

相互作用, 趋势, 未分类

[뉴미디어서비스팀 정지혜] “Conversational AI(대화형 인공지능)”는 다양한 형태의 대화 기반의 애플리케이션을 포함하며, 그 중에는 텍스트 기반의 챗봇부터 음성을 활용한 가상 비서,…

9 月202023

ChatGPT외에도, 주목해 볼만한 한국어 AI서비스 3가지

[뉴미디어서비스팀 윤응식] 챗GPT와 미드저니의 등장으로 AI 기술에 대한 관심이 높아졌습니다. 이 두 가지 서비스는 자연어 처리와 대화 인터페이스 분야에서 놀라운…

8 月142023

Runway Gen-2 : Text To Video 기술로 손쉽게 동영상 만드는 법

[뉴미디어서비스팀 이진희] 오래 전 영화계를 강타했던 ‘해리포터’ 시리즈를 기억하시나요? ‘해리포터’ 영화 속에는 신기하고 마법같은 일들이 많았지만, 그 중에서도 호그와트 벽에…

8 月22023

LoRA로 세아를 AI속에서 영원히 살아 숨쉬게 만들기. (부제. MK3 춘자를 기리며)

LoRA 로 세아 캐릭터의 특징을 학습하기

7 月242023

码

노코드로 알람 메시지 구성하기

码

[분석AI서비스팀 전소희] 이번 글에서는 노코드로 알람 메시지 내용을 구성한 방법에 대해 이야기 해보도록 하겠습니다. 실제 AI 분석 포탈에서 알람 메시지 전송…

7 月192023

ACL 2023 학회 참관기

[선행AI기술팀 전동준] 세계 3대 자연어처리(NLP) 학회 중 하나인 ACL 2023(Association for Computational Linguistics, 전산 언어학 학회)이 7월 9일부터 14일까지 캐나다…

7 月112023

趋势码

StarCoder

[분석AI서비스팀 이현정] 지난 해 9월에 시작한 Huggingface와 ServiceNow Research의 협업 프로젝트 Bigcode에서 올해 5월 오픈 소스 코딩 모델을 출시했습니다.StarCoderBase, StarCoder,…

7 月42023

自然语言处理趋势码

파일 번역: 모델링보다는 서비스 관점에서의 엔지니어링

自然语言处理, 趋势, 码评论

[가상생명연구팀 김석겸] 이 글에서 소개 드릴 프로젝트의 주제는 “파일 번역” 입니다. 번역 모델을 개발하기 앞서 기존에 서비스 중인 번역 서비스들을…

6 月302023

3D Aware Image Synthesis 에서 Text to 3D 까지

[생성지능개발팀 정재철] 최근 이미지 생성 모델은 생성물의 수준이 많이 올라감과 동시에 text to image라는 방식이 제안 되면서 사용 난이도도 감소하여…

6 月152023

趋势码

Triton Inference Server로 모델 서빙 성능 끌어올리기

[분석지능개발팀 박효주] 딥러닝 기술의 발전으로 AI 모델의 성능은 점점 향상되고 있고 있습니다. 하지만 그만큼 모델의 크기는 점점 거대해지고 추론 속도는…

6 月82023

AI 기술의 넥스트 스텝, ‘마인드 업로딩’이 될 수 있을까?

[뉴미디어서비스팀 김상우 부책임] AI, 인공지능, 모델… AI 기술 관련해서도 한창 발전하고 있는 와중에, 넥스트 스텝을 예측해 봅니다. 그 전에, 마인드…

5 月252023

自然语言处理趋势数据

Domain-specific language model의 필요성

自然语言处理, 趋势, 数据

[가상생명연구팀 양승무 주임] ChatGPT의 시대가 도래하고 있습니다. AI 업계를 비롯한 다양한 산업과 분야에서도 ChatGPT의 우수성과 실용성이 인정되어, 많은 기업들이 ChatGPT의…

5 月222023

헐리우드가 멈췄다! AI 밥그릇 싸움 시작 되나?

[뉴미디어서비스팀 유선민 부책임] 한국에서도 큰 인기를 끌고 있는 SNL 코리아의 원작인 미국의 SNL (Staturday Night Live)이 제작 중단을 선언했다. 그뿐…

5 月172023

이동형 AI 로봇: 일상 속에 자리 잡은 혁신적인 서비스

[AI Lab 유연오] 일상 속에 자리 잡은 이동형 AI 로봇 이동형 AI 로봇은 일상 속에서 심심찮게 볼 수 있습니다. 요즘…

5 月132023

自然语言处理 RL 相互作用趋势码

LangChain: If you know ChatGPT, without question

自然语言处理, RL, 相互作用, 趋势, 码

[가상생명연구팀 황준선] ChatGPT와 Bard 등, 요즘 대화형태의 대형 언어 모델(LLM)이 우후죽순 발표되고 있다. 하지만, LLM만 있다면 학습한 데이터 안에서만 적절한…

5 月92023

AI가 콘텐츠 창작을 대체할 날, 얼마나 가까워졌을까?

[뉴미디어서비스팀 정지혜] 최근 몇 년 동안 인공지능 기술이 급격하게 발전함에 따라, 콘텐츠 제작 분야에서도 인공지능 기술을 활용한 새로운 시도들이 이루어지고…

4 月172023

챗 GPT를 활용한 버츄얼 유튜버 컨셉아트 제작기

[뉴미디어 서비스팀 윤응식] 인공지능의 발전과 상용화로 인해 우리의 삶은 점점 더 풍요로워지고 있다. 특히 챗 GPT와 같은 대화형 AI는 다양한…

3 月152023

GPT-4라는 이름의 유령

[분석지능팀 김무성] 작년 연말 갑작스럽게 등장한 ChatGPT 이후로 GPT-4에 대한 여러 소문이 있었습니다. 그리고 저번 주에 ‘곧 공개될 거야!’라는 뉴스[1]가…

3 月132023

Kaiber.ai – Image to Video 기술로 1분 만에 멋있는 영상 만들기

[뉴미디어서비스팀 이진희] 요즘은 쇼츠, 틱톡 등 1분 이내의 짧은 영상을 시청할 수 있는 플랫폼이 많이 발달하여, 영상 콘텐츠에 접근하기가 더…

3 月32023

AI 기술로 3D 모델링을 빛나게 하는 비밀 (ChatGPT x Blender)

[뉴미디어 서비스팀 윤형진 책임] 본 포스팅에서는 ChatGPT와 DreamTexture를 활용하여 3D 모델링과 텍스쳐 생성을 어떻게 할 수 있는지에 대해 설명하고, 이…

2 月242023

AI Painter Kids – 어린이들을 위한 간단한 토이 프로젝트를 소개합니다!

[생성지능개발팀 한현준 X 정택현] ㅤ 최근 AI 분야의 급속한 발전과 함께, Diffusion 모델을 필두로 하는 생성 모델이 크게 주목받고 있습니다.…

2 月142023

趋势新闻

마음까지 치유하는 AI 기술

趋势, 新闻

[분석지능개발팀 전소희] 이번 주제는 몸을 넘어서 마음을 치유하는 고마운 AI 기술에 대해 살펴보겠습니다. AI 인공지능의 다양한 기술들은 현재 우리 생활…

2 月132023

AI Trends In 2023

[AI센터 한대웅] 음성과 언어기반의 AI, 윤리와 설명 가능한 AI, 생성 AI의 확장, 지속가능한 AI를 기반으로 본격적으로 사업화 도전하는 한해가 될…

12 月232022

GameAI RL 趋势

게임 영상만 가지고 마인크래프트 학습 하기 (Video PreTraining by OpenAI)

GameAI, RL, 趋势

[가상생명연구팀 박주형] 최근 강화학습에서 많이 주목 받고 있는 분야 중에 하나가 Offline 학습 입니다. 기존 강화학습은 시뮬레이터를 통해 실시간으로 trajectory를 받아서…

12 月192022

Character.AI – 채팅 친구를 만들어 봅시다!

[가상생명연구팀 전동준] 일론 머스크나 걸그룹 트와이스와 채팅으로 무슨 대화를 나눌 수 있을까요? 내가 좋아하는 게임 속의 가상의 캐릭터에게 궁금한 것을…

12 月62022

OpenAI – ChatGPT

[가상생명연구팀 심홍매] 얼마 전 Open AI에서는 대화에 최적화 된 LLM의 GPT-3.5 시리즈를 기반으로 하는 최신 모델 ChatGPT를 공개하였는데요. 공개되자 마자…

12 月62022

월드컵에서 활약하는 SAOT

[AI센터 권은지] 올해 2022 카타르 월드컵에서는 국제축구연맹(FIFA)이 개발한 반자동 오프사이드 판독 기술 (SAOT, Semi-Automated Offside Technology)이 처음으로 적용되었습니다. 세계 각국의…

11 月302022

The Future Of Streaming

[AI센터 한대웅] 얼마전 초등학생들의 장래 희망에 유튜버가 떠오르고 있다는 기사를 보고 깜짝 놀란적이 있었다. 미디어의 중심이 거대 기업 혹은 전문가가…

11 月82022

趋势码

ML 모델 Lifecycle 관리 – MLflow

[분석지능개발팀 박효주] ML 모델의 Lifecycle은 연구 및 테스트를 진행하는 Research 단계와 실제 서비스화하는 Production 단계로 나눌 수 있습니다. Research 단계에서는…

10 月252022

自然语言处理言语趋势

STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

自然语言处理, 言语, 趋势

[가상생명연구팀 김석겸] (대표 이미지는 stable diffusion 을 통해 생성되었습니다.) 음성을 입력으로 받아서 텍스트 생성의 결과를 음성으로 받고 싶을 경우, 기존에는…

10 月142022

RL 趋势

AlphaTensor

RL, 趋势

[가상생명연구팀 전동준] 지난 10월 5일, DeepMind는 과학 학술지인 Nature지에 AlphaTensor가 행렬 연산의 최적화 방법을 찾아냈다고 발표하였습니다.

9 月302022

自然语言处理趋势码

BigCode

自然语言处理, 趋势, 码

[분석지능개발팀 이현정] Huggingface와 ServiceNow Research가 함께 지난 27일 새롭게 런칭한 프로젝트 BigCode에 대해 소개하고자 합니다. BigCode는 Code를 위한 대규모 언어모델의…

9 月192022

趋势数据

Feature store: Fully managed service for ML Feature

趋势, 数据

[분석지능개발팀 임창대] What is Feature?ML(Machine Learning) 은 과거의 예시 데이터를 학습한 모델을 기반으로 새로운 데이터 예측을 수행합니다.ML 모델 학습에서 표…

9 月152022

Die or Upload?

[AI센터 한대웅] 2033년 미래의 지구는 AI로 제어되는 자율주행 자동차로 모든 교통수단이 안전하게 통제되고 있어 교통사고로 죽을 가능성은 0%에 가깝다. 20대…

9 月42022

DreamBooth: Personalized text-to-image diffusion model

[가상생명연구팀 심홍매] 올해 5월에 구글에서는 텍스트 입력을 기반으로 사실적인 이미지를 생성할 수 있는 텍스트-이미지 확산 모델(Diffusion Model)인 Imagen을 공개하였는데요, 몇개월이…

8 月292022

코딩없이 MobileFaceSwap 을 체험해보자!

[생성지능개발팀 정택현] ㅤ MobileFaceSwap은 AAAI 2022에서 공개된 오픈소스 Face swap 모델로, 기존 Simswap, FaceShifter 모델을 Distillation 기반의 경량화를 적용하여 연산 속도의…

8 月222022

진짜 같은 가짜 데이터 – 대체되는건 나?

[생성지능개발팀 정우석] 진부한 이야기이지만 AI 연구에 있어서 데이터의 중요성은 아무리 강조해도 지나치지 않습니다. 수많은 학교, 연구기관이나 기업에서는 앞다퉈 기술력 자랑과 연구…

8 月212022

코딩없이 YOLOv7을 체험해보자!

[생성지능개발팀 정택현] ㅤ 최근 YOLOv7 알고리즘이 공개되며 컴퓨터 비전 및 각종 관련 커뮤니티에서 큰 주목을 받고 있습니다. 논문에 따르면, YOLOv7은…

8 月192022

언리얼 엔진과 AI 의 만남

[생성지능개발팀 강민지] AI 연구가 지속적으로 이루어지고 있는 요즘, 사람들은 AI기술의 능력이 인간을 대체하거나 혹은 뛰어날 수도 있다고 여기며 이 기술과의…

8 月182022

인공지능은 우리를 어디까지 대체할 것인가?

[생성지능개발팀 유희조] 문명의 발전은 항상 사람을 더 편하게 만들어왔습니다만, 동시에 사람이 필요했던 업무를 꾸준히 대체해왔습니다. ‘기계가 노동자의 일거리를 줄인다’ 라는…

8 月162022

BlenderBot 3

[가상인간연구팀 황준선] Facebook의 Meta AI는 BlenderBot[1]이라는 대화형 인공지능 시스템을 개발하고 있다. BlenderBot2는 해당 포스트에서 다룬적이 있다. BlenderBot은 성격, 공감, 지식과…

8 月92022

趋势码

ML 프로토타입 빠르게 배포하기 – Streamlit, Gradio

[분석지능개발팀 박효주] 데이터 과학자들은 다양한 실험을 통해 학습된 모델의 성능을 검증하고 배포합니다. 이 검증 과정은 Accuracy, Precision, Recall, IOU, PSNR…

8 月22022

自然语言处理相互作用趋势码

Transformers United

自然语言处理, 相互作用, 趋势, 码

[AI Lab 김무성] 스탠포드의 CS25 : Transformers United 강좌 동영상이 최근 공개 되었습니다. [1] 강좌[2] 자체는 작년 하반기입니다만, 그간 슬라이드만…

7 月212022

자네 지금 잘하고 있는겐가 in Goal-Oriented Dialogue

[가상인간연구팀 김석겸] 목적 지향 대화(Goal-Oriented Dialogue) 혹은 과제 지향 대화(Task-Oriented Dialogue, TOD)는 특정 업무를 달성하는 것을 목표로 대화하는 것을 말합니다.…

7 月192022

VR and Physics Engine

[AI센터 권은지] 현실과 가상의 경계를 좁히는 키워드는 시공간 데이터 베이스와 디지털 트윈(Digital Twin)을 비롯하여 다양하게 존재합니다. 그 과정에서 3D 모델링…

7 月142022

소 잡는 칼로 닭 잘 잡아보기

[가상인간연구팀 전동준] 언어 모델(Language Model, LM)은 단어나 문장을 확률적으로 예측하는 모델입니다. 통계적으로 다음에 등장할 단어들을 모델링하는 전통적인 방식에서 최근에는 딥러닝…

7 月132022

LaMDa is Not Alive

[생성지능개발팀 한현준] 얼마 전 구글의 연구원인 Blake Lemoine은 언어 모델인 LaMDa가 자의식이 존재한다라는 주장을 펼쳤으나, 구글에서는 자의식의 증거를 찾을 수…

6 月292022

Kubernetes 패키지 매니저 Helm

[분석지능개발팀 임창대] Helm 은 Kubernetes 클러스터에 앱 및 서비스를 배포할 수 있게 단일 패키지 형태로 구성하고 관리할 수 있도록 도와주는…

6 月292022

Tesla Bot : Optimus

[분석지능개발팀 이현정] 지난 21일 테슬라는 카타르 경제 포럼에서 인공지능 휴머노이드 로봇 코드명 ‘옵티머스’를 3개월 내 선보일 예정이라고 밝혔습니다. 옵티머스는 인간이…

6 月242022

AI 플랫폼과 MLOps의 발전

[분석지능개발팀 송지현 연구원] McKinsey Global Institute에 따르면 “2025년까지 가치 생산 워크플로에 AI를 완전히 통합하는 기업이 2030년에 세계 경제를 지배하고 현금…

6 月242022

自然语言处理趋势数据

SmileStyle 한국어 대화 스타일 변환 데이터셋

自然语言处理, 趋势, 数据

[생성지능개발팀 김성현] 저희 센터의 인공지능 연구 모토는 ‘Human-like AI’ & ‘Fun AI’ 입니다. 그렇다면, 단순히 날씨나 뉴스를 알려주는 챗봇을 넘어,…

6 月162022

스마일게이트의 AI Media Studio를 소개합니다. (2부)

[생성지능개발팀 정택현] ㅤ 컨텐츠 홍수라고 불리우는 최근에는, 우리가 접하는 미디어 컨텐츠들이 양적으로나 질적으로 이전과는 비교할 수 없게 다양화되고 또한 고도화되고…

6 月12022

상상을 현실로 그리는 AI

[가상인간연구팀 심홍매] 텍스트, 이미지, 음성 데이터 등 다양한 형태(modality)로 이루어진 데이터 특징을 효과적으로 학습하기 위한 방법을 Multimodal learning이라고 하는데요, 최근…

5 月312022

한국어 tokenizer

[생성지능개발팀 김성현]우리는 한국어 문서를 볼 때, 그 대상을 의미를 가지는 단위로 쪼게서 이해할 수 있습니다.예를 들어, “스마일게이트” 의 경우, “스마일”…

5 月292022

Artificial Intelligence in Space

[AI센터 한대웅] 스타쉽 엔터프라이즈가 등장하는 Star Trek은 1965년을 시작으로 수많은 드라마와 영화를 통하여 인류의 영역을 수십억 광년의 우주로 확장시킨 SF…

5 月192022

Meta AI OPT-175B 공개와 large scale model

[생성지능개발팀 유희조] Open AI의 GPT-3 발표 이후 ‘더 큰 언어모델’ 라는 형태의 경쟁은 하나의 패러다임이 되었습니다. Nvidia, Microsoft, Google 등의…

5 月162022

TPU에서 HuggingFace model 학습하기

[가상인간연구팀 황준선] TPU 소개 TPU(Tensor Processing Unit)는 Google에서 발표한 텐서 연산에 특화된 하드웨어입니다. TPU는 인공지능 모델을 학습시킬 때 필요한 행렬…

5 月112022

Bring your own Desk

[AI센터 권은지] 비대면 소통 방식이 일상화되며 직장인의 근무 형태는 변화하였습니다. 원격 근무는 이미 하나의 표준으로 자리 잡게 되었으며 많은 기업이…

5 月102022

趋势码

프로그래밍하는 AI : AlphaCode

[분석지능개발팀 박효주] DeepMind가 경쟁 프로그래밍 대회에서 사용 가능한 수준의 프로그래밍이 가능한 AlphaCode를 공개했습니다. AlphaCode는 Transformer 기반 언어 모델을 사용하여 대량의…

5 月102022

Motion 视觉效果

포즈 추정 모델과 아바타

Motion, 视觉效果

[생성지능개발팀 한현준] 포즈 추정 모델의 발전 RGB 이미지만으로 포즈를 인식하는 모델은 지난날에 비해 비약적인 발전을 했습니다. 인식의 정확도는 많이 높아졌으며,…

4 月282022

GameAI 趋势

AI가 사람처럼 게임 플레이 소리를 듣는다면?

GameAI, 趋势

[행동지능연구팀 이정우] 바둑과 같이 경우의 수가 매우 많은 복잡한 게임에서 알파고는 최고 수준의 프로기사를 넘어서는 모습을 보여줬습니다. 알파고 이후에 진행…

4 月262022

趋势码

노코드 AI가 작성한 코드을 검증하는 AI : JIGSAW

[분석지능개발팀 이현정] 마이크로소프트(Microsoft)가 노코드(no-code) 기반의 AI가 작성한 프로그램 코드를 검사하는 도구 ‘직소(Jigsaw)’를 발표했습니다. 노코드란 간단한 사용자 인터페이스 방식의 틀을 이용해서…

4 月122022

Making 3D Virtual Human Chatbot

[가상인간연구팀 전동준] 요즘은 대화 모델이 외모를 가진 가상 인간으로 진화하고 있는데요. 다양한 연구와 시도들을 어떤 식으로 결합하고 확장할 수 있을지…

4 月32022

스마일게이트의 AI Media Studio 소개합니다. (1부)

[생성지능개발팀 정택현] ㅤ “AI 기술이 창작활동을 지원하게 되면 컨텐츠 제작, 가상인간 등 다양한 분야에서 앞으로 어떠한 변화를 이끌어 낼 수…

4 月12022

NVIDIA Research Turns 2D Photos Into 3D Scenes in the Blink of an AI : NeRF

[가상인간연구팀 송지현] 최근 NVIDIA 연구팀은 Showcased in a sessio at NVIDIA GTC 에서 가상 세계를 위한 아바타를 생성하거나 또는 장면을 생성하고,…

3 月262022

What Is Edge AI?

[분석지능개발팀 임창대] Edge AI는 Edge computing 에서 시작된 것으로 사용자의 디바이스에서 인공지능 알고리즘을 처리하는 것을 말합니다. IoT, 웨어러블 디바이스, 자율주행과…

3 月242022

수학 정리로부터 밝혀지는 AI의 한계

[행동지능연구팀 최현우]어렸을 때 읽었던 책 중에 아직까지도 기억에 남는 소설 중 하나인 <사람들이 모두 미쳤다고 말한 외로운 수학 천재 이야기>에서는,…

3 月182022

Adobe: Edit your face as you want

[가상인간연구팀 심홍매] 이미지 합성에서 이미지의 얽힘(entanglement)문제를 푸는 건 아주 중요하고 어려운 문제입니다. 예를 들어 사람의 얼굴에 있는 모든 수염을 자동으로…

3 月142022

Paradigm Shift On AI

[AI센터 한대웅] “패러다임 시프트” 라는 단어의 사전적인 의미는 어떤 문제나 현상을 바라보는 전제나 접근 방법에 대한 근본적인 변화 혹은 인식의…

3 月42022

AI’s copyright?

[생성지능개발팀 유희조] AI는 근 10년간 다양한 업종에서 영향을 끼치고 있으며 과거의 매우 단순한 반복작업을 대체하는 것에서 그치지 않고 이미 예술에…

2 月252022

自然语言处理言语码

An Open Source Framework for Conversational AI: NVIDIA NeMo

自然语言处理, 言语, 码

[가상인간연구팀 황준선] NVIDIA NeMo는 간단한 Python 인터페이스를 사용하여 GPU 가속 음성 및 자연어 이해 모델을 구축, training 및 fine-tuning하기 위한…

2 月212022

AI 기반 모바일 프로토타입 제작 – PyTorch Live

[분석지능개발팀 박효주] 작년 12월 초, Meta에서 AI 기반 모바일 프로토타입 제작이 가능한 PyTorch Live를 출시했다. 이제는 안드로이드, iOS 개발을 해본…

2 月92022

Human Pose Estimation을 위한 오픈소스 라이브러리

[생성지능개발팀 조원] 인간의 관절이나 자세를 localize하는 human pose estimation은 computer vision 분야의 중요한 task중 하나로서 오랫동안 발전해 왔습니다. 과거에는 사람의…

1 月282022

趋势数据

AI Fairness:편견 없는 인공지능을 위하여

趋势, 数据

[서비스개발팀 임용택] 2015년 6월, 미국 브루클린의 한 흑인 프로그래머는 여자친구와 찍은 사진을 보려던 중 깜짝 놀랄 일을 경험합니다. 구글 포토에…

1 月242022

Motion 趋势

자연스러운 NPC를 위한 AI Motion 기술

Motion, 趋势

[선행연구팀 이정우] 현실적인 캐릭터 움직임은 User에게 게임의 재미를 극대화 시킬 수 있는 요소로 작용 합니다. EA Sports에서는 FIFA 22에 새롭고…

1 月232022

현실로 다가오는 가상세계 CES 2022

[서비스개발팀 권은지] 올해 CES(Consumer Electronics Show) 2022는 미국 라스베이거스에서 2년 만에 오프라인으로 재개되었습니다. 한국정보통신기술산업협회(KiCTA)에 따르면 전 세계에서 2200여곳의 기업이 참여하였으며…

1 月232022

自然语言处理视觉效果言语趋势

Data2vec: 다양한 modality의 학습을 위한 프레임워크

自然语言处理, 视觉效果, 言语, 趋势

[생성지능개발팀 김성현]인간은 세상을 학습할 때, 다양한 감각을 동시에 이용하며 학습합니다.그리고 모든 감각은, 이를 감지하는 신경세포(neuron)의 발화(spike)로 변형되어 [1,0] 의 신호로…

1 月132022

自然语言处理言语趋势

보고 듣는 것으로 말을 이해하는 AI

自然语言处理, 言语, 趋势

[서비스개발팀 한현준] 서론 사람들은 AI 스피커에서 난청 장애가 있는 사람들을 위한 도구 개발에 이르기까지 광범위한 음성 인식 및 이해 작업에…

1 月102022

크리에이터를 위한 플랫폼

[서비스개발팀 한현준] 최근 엔비디아에서 AI 워크플로, 3D 디자인 협업 및 시뮬레이션 플랫폼 ‘Omniverse’를 RTX 제품을 사용하는 개인 크리에이터와 아티스트에게 무료로…

1 月72022

AI 기술을 활용하여 아이들의 그림에 생명 불어넣기

[선행연구팀 정택현] 가끔, 아이들은 우리의 상상력을 뛰어넘는 놀랍고 창의적인 캐릭터들을 그려내곤 합니다. 이러한 아이들의 그림을 이해하기 위해서는 우리의 상식과는 조금…

12 月302021

AI를 이용한 코로나 확진자 역학조사 시스템

[서비스개발팀 이현정] 지난 2019년 12월 이후부터 현재까지 인류는 팬데믹 상황에 처해 있고, 아직도 진행 중이며 끝날 줄 모르고 이어져오고 있다.오랜…

12 月242021

기억은 어디에 저장되는가?

[융합연구팀 전동준] “어제 홈스파 3편 보고 왔어요” 라고 누군가가 말한다면 여러가지 반응이 나올 수 있습니다. ‘홈스파’가 마블에서 제작한 스파이더맨 영화…

12 月122021

Semantic Segmentation

[서비스개발팀 권은지] 영상 분할(Semantic Segmentation) 기술은 컴퓨터 비전 분야에서 가장 핵심적인 요소 중 하나이며, 이미지 내의 픽셀별로 해당 픽셀이 어디에…

12 月92021

自然语言处理视觉效果相互作用趋势

감정, 그리고 기본 감정

自然语言处理, 视觉效果, 相互作用, 趋势

[융합연구팀 최현우] 여러분은 감정이라는 단어를 들으면 어떤 것들이 떠오르시나요? 예전부터 희로애락 (기쁨, 분노, 슬픔, 즐거움) 이라는 개념이 있었고, 감정 연구에…

12 月62021

Nvidia GPU Cloud: 도커 컨테이너를 사용한 딥 러닝

[서비스개발팀 임창대] 높은 정확도를 가진 딥러닝 모델 개발에는 긴 시간이 소요됩니다. 모델 훈련과 미세 조정, 최적화를 거치며 만족하는 모델을 만들기까지…

12 月62021

Microsoft _NUWA : Visual Synthesis Pre-training for Neural visUal World creAtion

[융합연구팀 송지현] Microsoft는 기존의 시각데이터(image and video)를 활용하여 새로운 시각데이터를 생성하고 조작할 수 있는 multimodal pretrained model인 NUWA를 발표했습니다. 아래…

11 月242021

Let an AI paint for you – GauGAN2

[융합연구팀 심홍매] 2019년에 열린 GTC 컨퍼런스에서 Nvidia는 GAN(generative adversarial networks)을 기반으로 대략적인 스케치를 사실적인 이미지로 바꿔주는 실시간 AI 페인팅 애플리케이션인…

11 月222021

Kubernetes 기반 ML모델 관리 및 배포 툴 ‘KubeFlow’

[서비스개발팀 임창대] ML(Machine Learning) 은 최근 몇 년 동안 점점 더 많은 관심을 받아 이제 주류로 부상한 IT 주제 중…

11 月132021

메타버스 붐을 냉소적으로 바라보는 또 하나의 시각

[선행연구팀 유희조] 최근 Google, Microsoft와 같은 월드 클래스의 빅테크 기업, 그리고 한국 내에 있는 많은 IT 업체들은 메타버스가 미래이며 메타버스…

11 月132021

Ego4D

[서비스개발팀 이현정] 페이스북이 지난 달인 10월, 차세대 AI 프로젝트인 1인칭 시점 AI 장기 프로젝트 ‘Ego4D’를 발표했습니다. 이 프로젝트를 위해 9개국…

11 月72021

Online 랜선 여행

[서비스개발팀 권은지] 랜선 여행이란 인터넷 연결선을 뜻하는 랜(Lan), 선(Cable) 그리고 여행(Trip)을 결합하여 인터넷으로 여행을 한다는 의미의 신조어입니다. 최근 국가 간…

11 月12021

Meta의 Metaverse Vision

[선행연구팀 이정우] 28일 페이스북은 사명을 ‘메타’로 변경하면서, 메타버스의 성공이 회사의 목표임을 다시 한번 강하게 보여줬습니다. 단순히 계획이 아님을 보여주듯이, 메타의…

10 月312021

Green AI

[융합연구팀 황준선] AI 기술은 비약적으로 발전해왔고, 우리는 많은 편의성을 제공 받고 있다. 심지어 이 AI 기술 분야 중에선 전력량을 예측하거나…

10 月272021

네이버의 자동 채색 소프트웨어 (웹툰 AI 페인터)

[서비스개발팀 김병인] 네이버가 웹툰을 기반으로한 인공지능 채색 사이트를 오픈 했습니다. 밝혀진 정보에 따르면 네이버웹툰이 3년동안 연구,개발한 기술들을 접목하여 만들어졌다고 하는데…

10 月262021

사람 같은 AI, AI 같은 사람

[융합연구팀 전동준] 우리가 일반적으로 생각했었던 “AI 같은”의 의미는 사람과 대비되는 기계의 느낌이 강했습니다. 감정이 느껴지지 않고, 말투도 딱딱한 사람들을 “AI…

10 月242021

Deep learning? Optimized learning!

[선행연구팀 김성현] 자연어처리 분야에서 pre-trained language model (PLM) 전략이 훌륭한 성공을 거두자, 더 많은 데이터를 이용해 더 큰 PLM을 개발하는…

10 月172021

Chatbot’s troubles

[서비스개발팀 한현준] 챗봇의 고민 OpenAI의 GPT-3, Google의 Meena, Facebook의 Blender 등 대형 자연어 처리 AI 모델은 인간의 언어를 실제 사람과…

10 月132021

현자의 돌

[융합연구팀 김무성] 최근 스탠포드의 연구자들이 “On the Opportunities and Risks of Foundation Models”라는 논문을 냈습니다 [1]. 여기서 Foundation Model이란 GPT-3와…

10 月62021

汇聚力量，汇聚风暴

【服务开发团队，Yeji Cho】美国人工智能研究协会（AAAI）前任主席Eric Horvitz博士和斯坦福大学……

9 月272021

搜索系统的进步和 NLP 的应用

[融合研究团队，Jihyun Song] LinkedIn 搜索系统的深度自然语言处理 Rasa…

9 月242021

人工智能 AutoML 人工智能

【服务开发团队韩贤俊】什么是AutoML AutoML字面意思是Auto + ML，一个自动化机器学习模型开发任务的过程。...

9 月122021

指令调优 – FLAN

【Convergence Research Team Hongmae Shim】2020年NLP领域排名前10的关键词，当然是GPT-3（Language Models are few shot Learners）排名。...

9 月122021

卡车编队

[服务开发组 Lee Hyeon-jeong] 国土交通省 9 日举行了关于卡车列队技术开发最终成果的介绍会。演讲内容是对编队技术的总体描述，基于V2X的编队……

9 月42021

视觉效果言语趋势

虚拟影响者趋势

视觉效果, 言语, 趋势

[服务开发团队，Eunji Kwon] 影响者的字典定义是影响他人的人。随着当今单人媒体渠道的发展，任何人都可以...

9 月22021

翻译器 2

[先前的研究团队 Hee-Jo Yoo] 从深度学习热潮的早期开始，翻译就是一个研究课题。现在任何领域都在使用的Attention，也是第一个解决了Seq2Seq结构的问题……

8 月272021

人工智能可以变成人吗？【策划面试】

人工智能可以变成人吗？（专访Smilegate.AI服务开发团队经理Eunji Kwon）AI音箱播放符合我当天心情的音乐。自动驾驶...

8 月252021

没有激光雷达能实现自动驾驶吗？

【服务开发组金炳仁】特斯拉最近决定发布北美销售的Model 3和Model Y的雷达。由于激光雷达已经被排除在外，只有汽车......

8 月212021

人工智能成为现实，特斯拉人工智能日

[前研究团队，Jeongwoo Lee] 在 2019 年举办的 Tesla Autonomy Day 上，介绍了技术和方向，重点是“自动驾驶”技术。顾名思义，今年的特斯拉AI日是一项名为“人工智能”的技术……

8 月202021

Copilot，帮助编码的人工智能

【前期研究团队Seonghyun Kim】在自然语言中引起极大轰动的因果语言模型（例如GPT-3），现在已经被应用到自然语言之外的编程语言！ 🤗 去年六月，…

8 月172021

类人人工智能

[服务开发组 Cho Ye-ji] 当我们定义像正常人一样的 AI 时，我们说它是像人一样行动和像人一样思考的 AI。每个人都期待的AI……

8 月82021

针对 AGI 的强化学习

[先前的研究团队 Hyunwoo Choi] 去年 5 月，DeepMind 发表了一篇名为“奖励就足够了”的强化学习论文。作者举例说明了“一只松鼠试图增加饱腹感”和“一个厨房机器人试图保持清洁”……

8 月62021

相互作用趋势码

Droidlet：开发智能机器人的开源平台

相互作用, 趋势, 码

[Service Development Team Jeon Jeon-jun] Facebook AI 于上个月 28 日推出了可在真实和虚拟环境中使用的机器人开发 Droidlet 平台。

7 月292021

托管机器学习平台 Vertex AI

[服务开发团队 Lim Chang-dae] 'Vertex AI' 在 5 月的 Google 开发者大会 IO 上亮相。 Vertex AI 是 Google Cloud 的…

7 月242021

相互作用趋势数据

Blender 2.0 克服了开放域聊天机器人的局限性

相互作用, 趋势, 数据

[Jihyun Song 前期研究团队] 对 Open Domain chatbot 感兴趣并接触 Blender 1.0 和 Meena 的论文已经有 2 年多了。那个时候，他们...

7 月192021

我的金手

【服务开发组Jo Ye-ji】NFT X Metaverse 自今年3月以来，NFT X Metaverse作为科技和投资关键词一直是最热门的话题。 …

7 月142021

多模态小样本学习器

【前期研究组Hongmae Shim】近日，随着Open AI的GPT-3、NAVER的Hyper CLOVA等超大型语言模型的发布，各种使用实例……

MLP歌手

[优先研究团队 Hee-Jo Yoo] TTS（文本到语音）是一种在输入任意文本时将文本转换为特定语音的技术。自从 Google 宣布推出 Tacotron 系列以来……

7 月52021

Tensorflow VS Pytorch

[服务开发团队 Hyeonjun Han] 介绍 Tensorflow 和 PyTorch 是最流行的机器学习库。开发 AI 服务的开发人员或研究模型的研究人员最初是……

7 月22021

永恒的光芒照耀着无罪的心

[前期研究组金武成] 永远的阳光导演米歇尔·冈瑞的电影《永远的阳光》讲述了金凯瑞和凯特温斯莱特夫妇之间的回忆和分离的故事。

7 月22021

相互作用趋势码

用于解决现实世界问题的强化学习环境

相互作用, 趋势, 码

[之前的研究团队，Jeongwoo Lee] 长期以来，我们一直在使用游戏（围棋、国际象棋、雅达利游戏等）来验证强化学习算法的性能。算法开发...

7 月12021

开源 GPT-3 模型发布，GPT-J-6B

[优先研究团队 Seonghyun Kim] 正在开放许可下发布 GPT-3 模型的 Eleuther AI 团队最近发布了一个新的 GPT-3 模型，具有 6B（约 60 亿）参数。（链接）Mesh-tensorflow 和 JAX…

6 月252021

趋势码数据

处理不平衡的数据集

趋势, 码, 数据

[服务开发团队 Hwang Jun-sun] 在监督学习机器学习模型时，当使用标签之间数据数量不平衡的数据集作为训练数据时，

6 月232021

视觉效果数据

主动学习的学习损失

视觉效果, 数据

[服务开发团队，Kyunghwan Lee] 我们在学习模型的过程中经常会遇到未标记的数据包，经常会遇到数据标注的问题。标签…

6 月102021

MLOps：机器学习的持续部署和自动化管道

【服务开发组 Lim Chang-dae】在 DevOps 出现之前，每个公司都有自己的服务器，称为内部部署服务器，并且有单独的服务器管理员、开发人员和 QA。这…

6 月42021

Unity ML-Agents v2.0

[Service Development Team Jeon Jeon-jun] Unity 推出的 ML-Agents 是一款开源工具，可为游戏环境创建虚拟角色。能够创建游戏环境并与之合作……

6 月12021

相互作用趋势数据

时序数据分析_TadGAN

相互作用, 趋势, 数据

【之前的研究团队Ji-Hyun Song】MIT研究团队开发的TadGAN算法在通过分析时间序列数据来检测异常方面比现有已知模型具有更好的性能。

5 月272021

机器可以思考吗？情感上

[服务开发团队，恩恩权（Eunji Kwon）]小时候，当我发挥想象力时，外太空机器人是最喜欢的材料。回想一下，一部卡通漫画（Galaxy Railroad 999）中的一台人工智能计算机可以移动火车...

5 月262021

[Hyper CLOVA]-韩国首个“超大型AI”

[先前的研究团队Hongmae Shim] NAVER将在25日举行的“ NAVER AI NOW”在线会议上展示韩国首款“超大型AI” Hyper CLOVA，这是韩国自行开发的GPT-3。

5 月212021

LaMDA-Google的会话语言模型

[服务开发团队Kim Byung-in]在Google I / O 2021上，该活动展示了最新的Google技术，Android，Web，人工智能，Chrome和其他技术，服务以及平台服务...

5 月202021

MoveNet：JavaScript姿势估计器

[前研究团队Yoo Hee-jo]姿势估计是一种视觉处理技术，用于跟踪视频中字符的移动。在某种程度上类似于普通的面部标志...

5 月142021

趋势数据

数据专家的价值

趋势, 数据

[服务开发团队Jeon Jeon Jeon]受Corona 19加速的公司的数字化转型继续增加数据的价值。不仅是专业的IT公司……

5 月122021

持续强化学习

[前研究团队Jeongwoo Lee]最近的强化学习表明，AI代理可以在各种任务中压倒人类的表现。但是，未经学习的AI代理会与人合作...

5 月62021

MetaHuman Creator-虚幻引擎

[服务开发团队Byungin Kim] MetaHuman Creator是Epic Games最近发布的一种数字化人类创作工具。它看起来类似于MMORPG游戏的角色创建，但是这种实时数字人...

5 月62021

语言模型中的自然语言生成策略

[Sung-Hyeon Kim前研究团队]最新的语言模型是使用大型语料库学习的。特别是在使用解码器神经网络的模型（例如GPT-2，BART和T5模型）的情况下，以下内容…

4 月262021

记录生活日志

[服务开发团队Eunji Kwon]生命日志这个词将生命和日志结合在一起，“当我们可能”为1945年美国国家科学技术研究院所长Baneva Bush贡献了“大西洋月刊” ……

4 月232021

图形转换器：用于结构化数据的转换器

应用于自然语言处理领域的变压器不仅已应用于文本，而且还应用于各种数据，例如图像和视频，具有出色的性能...

4 月162021

基于GPT-3的游戏NPC演示

将10年前的游戏与当前的游戏进行比较，存在很多差异，尤其是在图形方面。例如4K或更高分辨率，复杂的图形纹理，...

4 月152021

HyperGAN：用于手机的GAN开源项目

当前在手机上运行的大多数装饰应用（例如Snow和Line Camera）都提取面部地标并覆盖先前创建的对象...

4 月92021

软件政策研究所Metaverse报告

Metaverse，这意味着虚拟环境中现实与连接的化身之间的所有形式的交互，最近引起了各行各业的关注。尤其…

4 月82021

GPT-新开源GPT-3项目

OpenAI的GPT-3是一种大型语言模型，参数计数高达175B。尽管GPT-3显示了惊人的结果，但它不是开源的...

4 月22021

图神经网络的应用

图神经网络（GNN）逐渐成为AI的新领域。 GNN是当数据以图形表示时，这种结构由许多节点和边连接，...

4 月12021

ImageNet和隐私

ImageNet是一个数据集，它极大地影响了AI技术的发展，因此没人知道AI研究人员。大量的图像和大约...

3 月262021

GAN模型（GANSpace）的可分析控制方法

作为基于深度学习的图像生成方法，GAN产生了许多惊人的结果。特别地，通过在学习后改变潜矢量，许多有意义的意义...

3 月252021

吸引$40M系列B拥抱面

有消息称，以基于深度学习的自然语言处理开源而闻名的Hugging Face吸引了$40M B系列投资。拥抱人脸变形金刚可能是一种自然语言...

3 月192021

视觉效果言语相互作用码

适用于移动设备的AI项目的集合（Awesome Tensorflow Lite）

视觉效果, 言语, 相互作用, 码

Tensorflow Lite是一个软件包，其中包含一些工具，这些工具允许使用Tensorflow训练的AI模型在移动设备上运行。目前有40亿...

3 月182021

基于深度学习的Jina-开源多模式搜索引擎

Jina由Jina.AI开源，是使用深度学习技术的多模式数据搜索引擎。不仅实现了一些搜索功能，而且在服务中也实现了...

3 月122021

人工智能与游戏（书）

基于深度学习的最新AI技术正在各个领域积极引入，例如语音识别，语音合成，翻译，聊天机器人和智能工厂，但游戏...

3 月112021

基于生成模型的Google Lyra语音压缩

Google Lyra是一种基于生成模型的新型语音压缩方法，现有的语音压缩方法可以达到原始的音质水平，即透明的音质。

3 月52021

预计2021年的AI市场规模约为$328B（IDC）

以其在各个领域的市场分析而闻名的IDC已发布了有关AI市场规模的预测。以下是相关链接：根据公告，到2021年…

3 月32021

Avatarify - 将实时头像添加到视频通信中

Avatarify是一个将实时头像动画功能添加到各种视频通信程序（例如Zoom，Team，Hangout和Skype）的程序，并且是开源的。摄像头的视频通讯程序...

2 月232021

DensePhrases-近实时Wikipedia开放域问答

DensePhrases是高丽大学的Jinjinuk Lee创建的一种开放域问答技术，已发表为题为“大规模学习短语的密集表示”的论文。这是论文的链接：…

2 月192021

言语相互作用码

自然语言和语音识别框架的整合趋势

言语, 相互作用, 码

以其集成的自然语言处理程序包而闻名的HuggingFace增加了语音识别。以下是相关链接：具体来说，添加了Facebook开发的Wav2Vec 2.0，Wav2Vec…

2 月192021

MeInGame-通过照片创建3D模型

通过单张照片创建3D模型的技术已经以MeInGame的名称公开。查看发布在公共存储库中的结果，设计师的工作...

2 月102021

PapersWithCode的韩国数据集

Paperswithcode提供有关AI，链接的开源和SOTA领域的各种论文的信息，并链接到3,000多个有用的数据集...

2 月102021

KakaoBrain集成的自然语言框架的Pororo

在Kakao Brain中，Pororo是一个能够响应各种自然语言任务的集成自然语言框架，已作为开源发布。 Pororo是自然模型的平台

2 月52021

Ubuntu对话框语料库

建立一个允许人类与虚拟代理进行自然对话的对话系统在自然语言处理中是一项艰巨的任务，并且正在进行许多研究……

2 月32021

数字孪生+ AI

数字孪生意味着将真实世界中具有实质内容的物体或环境移动到虚拟空间中，并将两者联系起来。简单的说…

1 月302021

RepVGG：残差网络的新解释

自从由多层卷积层组成的AlexNet问世以来，已有许多关于深度学习模型结构的研究。例如，Google Inception是3×3，…

1 月272021

大型模型的内存优化技术

随着深度学习模型的参数数量显着增加，训练所需的内存也随之增加。 OpenAI的GPT-2由1.5B参数组成，而Google的mT5也在13B中。

1 月212021

码

分布式学习框架：Horovod和RaySGD

码

随着深度学习模型的规模呈指数增长，不再难于通过一台机器实现可用的学习时间。知名对话...

1 月182021

AI研究中要考虑的五种大脑功能

诚然，人工智能领域已经取得了很大进步，但与人类相比仍然存在许多缺点。如果AI的最终目标是人脑怎么办...

1 月132021

视觉效果相互作用

OpenAI DALL-E：从文本创建图像

视觉效果, 相互作用

OpenAI发行的DALL-E是一种可以从自然语言文本生成图像的技术。以前，有用于相同目的的技术，例如StackGAN和OP-GAN，但是DALL-E是非常大的语言模型...

1 月112021

DeBERTa：在SuperGLUE中超越人类表现

SuperGLUE是一项挑战，需要针对各种自然语言理解任务评估AI技术的性能。与现有GLUE相比，包含较高难度的任务...

1 月82021

2021年AI的下一步是什么？

自从2012年开始认真学习深度学习以来，人工智能技术已经在许多领域超越了现有技术的性能。虽然环境有限...

1 月62021

开放域聊天机器人“ Luda”育儿日记：从出生到内测的记录

最近正式发布的ScatterLab（https://scatterlab.co.kr/）的“ Luda”是一个开放域聊天机器人，已根据数十亿个KakaoTalk对话数据进行了学习，任何人都可以通过Facebook Messenger聊天。 …

1 月42021

用口头信息诊断阿尔茨海默氏症的技术

痴呆是一种大脑功能严重恶化以至干扰日常生活的现象，阿尔茨海默氏病是60%-80%最常见的痴呆。

12 月302020

开源聊天机器人框架：Kochat，Rasa，Rocket Chat

KoChat是由Hyunwoong Ko发布的韩国开源聊天机器人框架。这是KoChat github存储库：当我们谈论聊天机器人时，我们通常只想到一种对话模型，但实际上……

12 月282020

FrankMoCap：3D身体和手部姿势估计技术可替代运动捕捉

Facebook AI Research（FAIR）发布的一项技术FrankMocap负责从单个图像或视频中提取3D模型的姿态。特别是身体……

12 月242020

数字人平台公司

数字人平台是一种将各种AI技术与具有人形外观的化身相结合的形式。得益于AI对话技术和可视化技术的进步...

12 月222020

人工智能趋势和游戏应用实例

这是一份总结了AI趋势和游戏公司AI技术应用案例的报告。大致的目录如下：AI是…人工智能市场与专业…

12 月212020

韩国亵渎数据

我们分享了Joonhee Jo收集并标记的一组韩国亵渎数据。它是从多个社区收集的，似乎适合评估实际数据。下边是...

12 月182020

BERTology能听懂语言吗？

由BERT代表的基于深度学习的大规模语言模型在与自然语言相关的各种任务方面表现出色，例如问答，文档摘要，文档生成和对话...

12 月152020

聚集镇：虚拟空间与视频会议

Gather Town是一种视频会议解决方案，例如Zoom和Teams，但它的特点是积极引入虚拟空间和虚拟形象。例如，一个名为“办公室”的虚拟空间…

12 月142020

UnifiedQA：单个模型可响应多个问答任务

由于最近的深度学习技术，为给定问题生成适当答案的QA任务获得了许多性能提升。著名的SQuAD也...

12 月112020

从段落中产生问题的技巧

通常被称为Q＆A任务的问题是从以成对的问题和答案记录的数据集中学习，以便在提出问题时会给出适当的答案...

12 月92020

POSTECH STUDIOGAN：GAN算法库

StudioGAN是由浦项大学CVLab康敏国发布的基于pytorch的开源库，并且实现了各种GAN算法。随附的GAN算法包括DCGAN，LSGAN，WGAN ...

12 月72020

FACEBOOK REBEL展示了超越人类的扑克技巧

毫不夸张地说扑克是一种心理游戏，因此它与围棋或国际象棋不同。 Facebook这次发布的ReBeL在这方面非常出色...

12 月42020

MELD：多模式情感数据

多模式EmotionLines数据集（MELD）是EmotionLines（一种带有情感标签的对话数据集）的多模式扩展。 EmotionLines可以使用MELD ...

12 月22020

CYBERPUNK 2077中使用的JALI面部动画技术

赛博朋克2077计划于2020年末由以巫师系列而闻名的CD PROJEKT RED工作室推出，它使用JaliResearch的面部动画技术。主要目的是3D…

11 月302020

MindMeld对话式AI平台

MindMeld是旨在确保可服务质量的开源交互式AI平台。使用Python编写的最新NLP技能和知识…

11 月272020

2020年AI状况报告

这是2020年AI状况报告，该报告分析了AI领域的各种变化。该报告与AI投资者Nathan Benaich在一起...

11 月252020

2区NPC AI改进方向

Division 2是由Massive Entertainment开发并由Ubisoft发行的在线动作RPG，位于华盛顿特区，在那里天花很流行。有政府特工的玩家...

11 月232020

阿凡达技术进入K-POP市场

阿凡达早在AI技术出现之前就已以各种形式使用，例如SNS，客户响应和游戏中的角色表达。

11 月202020

Unity ArtEngine

Unity的ArtEngine是一种工具，可使用基于AI的技术轻松创建高质量的图形资源。在Unity中，这些技术称为AI辅助艺术性...

11 月182020

言语码

Facebook Denoiser：实时语音增强

言语, 码

我们共享去噪器github的链接，这是在INTERSPEech 2020上宣布的Facebook实时降噪技术。它在Pytorch中实现，原始论文的标题为“实时”。

11 月162020

与智能手机相比的AI市场规模

根据IDC预测报告，到2020年AI市场规模预计约为157B$。当然，这个数字涉及与AI相关的各个行业，即...

11 月112020

视觉效果相互作用码

视频质量检查–您只需3D注意

视觉效果, 相互作用, 码

通常，问答系统使用文本回答问题。在这类任务中，您需要给出一段解释事实，提出问题并给出适当答案的段落...

11 月102020

UneeQ的数字人性平台发布

UneeQ已启动了一个名为Digital Human Creator的数字人类平台。尽管服务价格有些负担，但我们提供免费试用，因此我们进行了简单的测试……

11 月62020

VIBE：根据图像预测3D人体模型参数

为了实现类似于人类的AI的可视化部分，有必要考虑如何创建和移动3D人体模型，但是现有的各种方法...

11 月42020

使用来自100多个国家/地区的数据对多语言翻译模型和语言模型进行了培训

为了将以前主要以英语研究的语言模型和翻译模型扩展为多种语言，人们进行了许多尝试。 Google的mT5是原始的T5（文本到文本…

11 月22020

借助咳嗽声预测电晕19感染的AI技术

Corona 19尚未在全球范围内表现出平静的迹象。麻省理工学院创建了一个AI模型，可以检查手机记录的咳嗽声是否感染了COVID-19

10 月302020

Adobe Neural Filter：更改图像编辑范例

Adobe宣布了一种基于AI的编辑工具，称为神经过滤器。有人说它已经包含在最新版本的Photoshop中。在示例功能中，图片...

10 月282020

2020年的四大事件表明AI在媒体压缩方面的趋势

认真考虑将2020年视为AI技术在媒体压缩领域应用的第一年。这是今年发生的四件事的简要介绍...

10 月262020

开放域聊天机器人的对话组合方法

在Ping-Pong博客上，有一篇名为“ Luda梦见超人AI的对话组成”的文章，但是在设计开放域聊天机器人时需要考虑许多方面。

10 月232020

基于蓝牙的COVID-19风险组识别技术

有许多使用AI技术与Corona 19相关的研究。以下共享的论文是Fraunhofer HHI的一项研究，该研究发表于《自然》，来自蓝牙低功耗（BLE）。

10 月212020

NVidia Maxine：基于AI的视频通信平台

NVidia推出了一个基于云的视频通讯平台，名为Maxine。 Maxine的功能是全面引入AI技术，特别是面部图像，例如H.264 ...

10 月192020

余冠舜恢复照片质量并改变面部表情

这是一张让我感到非常咸的照片。基于深度学习的面部编辑技术...

10 月162020

Vid2Player：基于视频分析的网球运动员动作生成

最近似乎有很多技术可以通过从人类运动中提取运动来创建新运动。（vid2vid，vid2game，pose2pose）Vid2Player在斯坦福大学研究，...

10 月142020

膳食v2：使用ResNet-50实现ImageNet Top-1 80%

当将多个网络模型组合在一起时，性能会提高，由于总网络规模和推理时间也会增加，因此很难在实践中应用它。

10 月122020

HuggingFace数据集1.0

Huggingface数据集库的第一个稳定版本1.0已发布，使使用NLP数据集和评估指标变得容易。现在…

10 月82020

根据强化学习创建可缩放的角色动画

很自然地看到虚拟角色并根据物理定律（即类人的定律）合理地运动。

10 月72020

视觉效果言语码

Wav2Lip：通过声音创建唇形

视觉效果, 言语, 码

LipGAN是一项使用语音信号生成脸部图像的嘴唇形状的技术，当将其实际应用于视频时，就视觉伪影和运动的自然性而言，这有点令人遗憾。

10 月52020

使用HuggingFace和ONNX Runtime进行NLP加速

基于Transformer的语言模型显示出的性能改进令人惊讶，但是随着模型大小的成倍增长，对服务成本的关注也变得越来越重要。 Bert-base或GPT-2…

9 月282020

国立韩国语学院AI学习的朝鲜语数据

国立韩国语学院已经大规模发布了用于人工智能学习的韩国语材料（13种18亿个单词）。它是通过解决版权问题而构建的，并在“每个人的语料库”网站上创建了在线协议，…

9 月252020

Gran Turismo的超人AI

该链接是对索尼和苏黎世联邦理工学院发表的一篇论文的评论，该论文通过对著名的汽车游戏《 Gran Turismo》进行强化学习，超越了人类记录。

9 月232020

相互作用趋势码

GPT-3示例和minGPT项目

相互作用, 趋势, 码

Scatterlab（https://scatterlab.co.kr/）在日常对话研究中很重要，它是乒乓球队博客上的一篇文章。

9 月212020

该年底的Webtoon样式生成代码

Bryandlee的github拥有使用深层生成模型进行图像翻译的结果，并且在冷静的人的后期研究中将相关研究制成了网络漫画。研究标题...

9 月182020

Facebook TransCoder：无监督学习编程语言翻译器

已经进行了许多尝试以一种编程语言编写的代码转换为另一种编程语言，并且有许多类型的商业工具。

9 月162020

视觉效果相互作用

人类和人工智能对图像分类问题的性能比较分析

视觉效果, 相互作用

Imagenet-1K（1000类图像分类问题）是一项随着CNN的发展而优化的任务。宣布深度学习时代开始的AlexNet的TOP-5错误是关于…

9 月142020

与AR Glass概念图进行交互的必要性

这是由设计师Iskander Utebayev创作的AR Glass概念视频。考虑到概念视频，它非常漂亮，一旦实现，就可以使用智能设备实现人机界面...

9 月112020

视觉效果言语码数据

Lip2Wav：仅通过嘴唇移动即可生成语音信号

视觉效果, 言语, 码, 数据

我听说过一些故事，如果您接受特殊训练，仅通过嘴唇的运动就可以知道您在说什么。

9 月92020

发行反映门户评论和新词的朝鲜语模型KcBERT

在大规模语言模型的情况下，总是存在困难，因为没有朝鲜语模型，继SKT的KoBERT，Naver注释数据，新单词等之后...

9 月72020

皮克斯的超分辨率技术及其应用

基于深度学习的超分辨率技术在NVidia的最新GPU中以DLSS（深度学习超级采样）的名称被采用，并且已经成为一种真正为消费者服务的技术。

9 月42020

与Google MixNet的实施关联性

图像中常用的卷积是3D操作。（KxKxC; K =内核大小，C =通道数）通过将其划分为通道方向上的KxKx1，1x1xC的多个2D操作来应用之后...

9 月22020

通过语音创建身体动作

LipGan是一项根据语音信号创建嘴形的研究。这项技术可用于创建虚拟角色的嘴部动画，但是在实践中应用时...

8 月312020

Microsoft Teams Together模式

近年来，随着非面对面视频会议变得越来越普遍，越来越多的人使用Zoom进行多人视频会议。一种叫做变焦疲劳的现象也引起了人们的注意。

8 月282020

H.266 / VVC标准和深度学习技术

已经发布了新视频编解码器的国际标准，该新编解码器名为（ISO MPEG）VVC或（ITU-T）H.266。分享相关文章。深度学习技术...

8 月272020

AI堕落或复兴

根据各种统计，与AI相关的主要会议参与者的数量在5年中增加了6倍，而AI初创公司的数量在4年中为28%。

8 月252020

视觉效果相互作用数据

多模式问答–视觉对话任务

视觉效果, 相互作用, 数据

可视对话框任务是一种多模式任务，可将图像添加到由问答组成的Q＆A任务中。例如，一只白猫和一只黑狗在一起...

8 月232020

人工智能和人类协作：新的集体智慧

分享您最近喜欢阅读的内容。在本文中，人类和人工智能在不同领域表现出色，而不是一方取代另一方...

8 月212020

从运动，骨骼和角度重新定向运动

我们共享了在SIGGRAPH 2019上发表的论文``学习面向二维运动重定向的角色不可知运动''的项目页面。本文（可能有所不同）…

8 月202020

视觉效果数据

Adobe Mixamo：3D角色模型打开数据

视觉效果, 数据

在游戏制作方面，我们共享一个指向经常使用的Adobe Mixamo网站的链接。当您输入时，出现121个3D字符和2484个字符运动...

8 月192020

言语码

FastSpeech2开源

言语, 码

TensorflowTTS是基于Tensorflow 2的开源，它支持几种最新的TTS模型，例如Tacotron2，MelGan，FastSpeech等，终于开始支持Microsoft FastSpeech2。 FastSpeech2是一款变压器...

8 月172020

AI：智慧与自动化

链接是引起人们对智能与自动化之间差异的很多关注的文章。神经网络在1960年代出现时就使用了人工智能这个术语...

8 月162020

反映面部表情和身体动作的情绪识别

已经进行了各种尝试来从图像或图像中识别情绪。它在云API中提供，并且众所周知，因此成为SNS的主题（乔伊95%等）。

8 月162020

基于GAN的图像压缩

在视频压缩领域中，与摩尔定律（晶体管的数量每两年翻一番），1993年的MPEG-1、2003年的MPEG-4 / AVC（H.264），2013年的MPEG-H / HEVC具有相同的特征（ H.265）...

8 月112020

文本到SQL：将自然语言转换为SQL

文本到SQL是自动将自然语言转换为SQL的任务。我在底部分享的帖子是由Microsoft的Aerin Kim撰写的，它是关于Text-to-SQL的良好组织。

8 月102020

介绍NVidia Ampere架构

在学习深度学习算法时，GPU被认为是必不可少的，但是在模型训练完成后提供服务时，将使用CPU而不是GPU ...

8 月102020

视觉效果言语码

Speech2根据语音信号进行人脸预测

视觉效果, 言语, 码

麻省理工学院的Speech2Face是一项通过语音信号生成说话者面部的研究。但是，并不是语音转换到语音转换是使用一个模型执行的，而是用于其他目的的现有模型...

8 月72020

言语

Google MixIT AI-无监督学习声源的分离

言语

由Google推出的MixIT AI是一项技术，该技术从混合了多个声源的单声道音频中获得单独的声源。可以将其视为盲目分离任务。

8 月72020

算法仇恨和可解释的AI

在预测领域，算法厌恶意味着当您意识到算法可能会犯错误时，即使它比人类预测更好也倾向于避免编写...

8 月52020

言语码

Wav2Vec 2.0公开-创建具有10分钟语音的ASR

言语, 码

Facebook的wav2vec成为热门话题，因为它在使用53,000小时的无标签数据进行了表示训练之后，创建了仅具有10分钟标签数据的语音识别器。

8 月52020

视觉效果相互作用数据

MIT DriveSeg-data用于道路状况意识研究

视觉效果, 相互作用, 数据

这是DriveSeg的数据集，用于研究道路状况（用于自动驾驶汽车等）。对于视频的每一帧，整个图像都是逐像素的语义标记…

8 月52020

引入无人驾驶技术和社会共识

尽管这是一个飞跃，但如果您考虑将物理设备添加到AI算法中作为智能机器人，那么将来也许是最受欢迎的智能机器人...

人脑与AI硬件比较

最近的趋势之一是使用超大型模型，即参数数量，以及常规学习方法的应用。人脑的“软件功能”…

机器阅读理解（MRC）任务和数据集安排

迄今为止提出的许多MRC模型在各种任务和数据集中显示出超出人类能力的评估值，但在给定背景下优于人类...

IBM的情感机器人直尾

这是IBM情感机器人Nao-mi的视频。 [内容提要]机器人说他不想与一个要求摧毁难以建造的塔的人打交道。为了持续的需求...

转移学习成为必要，而不是一种选择

GPT-3是超大规模语言模型的代名词，它的学习成本与韩华有关，这表明仅通过很少的镜头学习就可以将其应用于所有自然语言任务的可能性。

用于图像动画的一阶运动模型

摇滚明星（Rockstars）于2011年拍摄的电影《洛杉矶黑色》（Los Angeles Noir）使面部动画效果远胜于其他游戏，许多人对此感到惊讶。目前使用的技术...

YouTube的发展导致知识失索引现象

随着数字化的到来以及Internet和Web的到来，知识被分发和存储在世界各地的服务器上，彼此连接并可以搜索，因此可访问性和可用性得到了极大的改善。图书…

Facebook上的Codec Avatar

已经发布了名为“ Codec Avatar”的Facebook数字人类项目的演示视频。与2019年的视频相比，这是增加的部分，并且头像的外观更加逼真...

GANimation-用一张图像创建面部表情的研究

它是GANimation的代码存储库，该技术可通过输入单个图像来创建可更改面部表情的动画。基本上，有条件的GAN是用来描述面部的解剖运动的。

虚拟人：Saya项目

日本的虚拟人类项目，Saya项目。它是日语的，所以我无法理解所有的进度，但是视觉效果很高，表达很自然。后…

视觉效果数据

Danbooru 2019-动画角色图像数据

视觉效果, 数据

介绍Danbooru 2019版本链接，这是一个动画角色图像数据库。大约有370万张图像，每个图像附有约29个标签。标签的...

苹果的超高分辨率VR耳机（iGlass？）

假设配备了类人AI的类人动物角色已经得到极大改善，可以将其显示在2D平面（例如计算机或智能手机屏幕）上，并使用鼠标，键盘和触摸...

视觉效果言语相互作用数据

RAVDESS-多模态情感数据

视觉效果, 言语, 相互作用, 数据

当音频视频被捆绑在一起时，有许多复杂的人类情感感知和表达方式（例如，愤怒的情感会影响面部表情，声音和语言）...

神经网络技术通过人类记忆的特性

我最近阅读了有关人类能力和神经网络之间的关系的信息。尽管它出现在文章中，但人脑和神经网络的工作方式却相似，但相同。

糖果粉碎传奇的类似人的测试

来自著名游戏公司King的Candy Crush Saga是一款具有大量关卡的益智游戏。这是2018年的数据，但每周增加15个级别...

复制品：情感聊天机器人

AI聊天机器人的主要任务是回答问题，例如解释产品信息，通知日程安排和检查天气。也许这些……

合成媒体的未来（合成）

这是Synthesia博客上的一篇文章，该文章使用“ Synthetic media”一词将AI技术应用于媒体营销。该公司的主要领域是视频中模型的面孔。

Rosebud.AI的虚拟模型综合技术

Rosebud.ai（https://rosebud.ai/）瞄准了市场营销市场，其技术可以在为营销活动创建的图像上创建和合成虚拟模型人脸。结果很自然，...

Roblox如何优化Bert

大多数聊天机器人系统仍然基于规则运行，但是为了实现自然对话，最终将需要使用更复杂的语言模型，例如BERT…

TikTok的漫画过滤器