言语趋势 STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

Bring your own Desk

[AI센터 권은지] 비대면 소통 방식이 일상화되며 직장인의 근무 형태는 변화하였습니다. 원격 근무는 이미 하나의 표준으로 자리 잡게 되었으며 많은 기업이 효율성을 유지하는 하이브리드 근무 모델을 모색하고 있습니다. 글로벌 IT기업들은 직원…

言语趋势 STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

현실로 다가오는 가상세계 CES 2022

[서비스개발팀 권은지] 올해 CES(Consumer Electronics Show) 2022는 미국 라스베이거스에서 2년 만에 오프라인으로 재개되었습니다. 한국정보통신기술산업협회(KiCTA)에 따르면 전 세계에서 2200여곳의 기업이 참여하였으며 이중 미국 기업이 1300여곳으로 가장 많았고, 한국 기업은 약 500여곳으로…

自然语言处理视觉效果言语趋势 STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

Data2vec: 다양한 modality의 학습을 위한 프레임워크

[생성지능개발팀 김성현]인간은 세상을 학습할 때, 다양한 감각을 동시에 이용하며 학습합니다.그리고 모든 감각은, 이를 감지하는 신경세포(neuron)의 발화(spike)로 변형되어 [1,0] 의 신호로 뇌로 전달됩니다. 예를 들어, 물체를 만지지 않았을 때는 세포의 발화가…

言语趋势 STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

翻译器 2

[先前的研究团队 Hee-Jo Yoo] 从深度学习热潮的早期开始,翻译就是一个研究课题。现在在任何领域都使用的注意力,也是第一个提出的解决 Seq2Seq 结构问题的方法。在过去的 10 年里,基于深度学习的翻译器……

MLP歌手

[优先研究团队 Hee-Jo Yoo] TTS(文本到语音)是一种在输入任意文本时将文本转换为特定语音的技术。谷歌发布 Tacotron 系列后,迅速从基于 HMM(隐马尔可夫模型)转向基于深度学习,现在已经商业化了……