SpeechTrend STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

Bring your own Desk

[AI센터 권은지] 비대면 소통 방식이 일상화되며 직장인의 근무 형태는 변화하였습니다. 원격 근무는 이미 하나의 표준으로 자리 잡게 되었으며 많은 기업이 효율성을 유지하는 하이브리드 근무 모델을 모색하고 있습니다. 글로벌 IT기업들은 직원…

SpeechTrend STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

현실로 다가오는 가상세계 CES 2022

[서비스개발팀 권은지] 올해 CES(Consumer Electronics Show) 2022는 미국 라스베이거스에서 2년 만에 오프라인으로 재개되었습니다. 한국정보통신기술산업협회(KiCTA)에 따르면 전 세계에서 2200여곳의 기업이 참여하였으며 이중 미국 기업이 1300여곳으로 가장 많았고, 한국 기업은 약 500여곳으로…

VisualSpeechTrend STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

Virtual Influencer Trend

[Service Development Team, Eunji Kwon] The dictionary definition of an influencer is a person who influences others. With the development of today's one-man media channels, anyone can become a creator and rise to so-called stardom by uploading interesting content. With friendliness…

SpeechTrend STT + LM + TTS 세 개나 개발해야 된다고? 난 AudioLM 하나로 끝!

Translatotron 2

[Prior Research Team Hee-Jo Yoo] Translation is a topic that has been studied since the early days of the deep learning boom. Attention, which is now used in any field, was also the first proposed method to solve the problem of the Seq2Seq structure. For the past 10 years, deep learning-based translator…

MLP Singer

[Priority Research Team Hee-Jo Yoo] TTS (text-to-speech) is a technology that converts text into a voice of a specific voice when inputting arbitrary text. After Google announced the Tacotron series, it quickly switched from HMM (hidden Markov model)-based to deep learning-based, and is now commercially…