자연어와 음성 인식 프레임워크의 통합 트렌드
통합 자연어 처리 패키지로 유명한 HuggingFace에 음성 인식 기능이 추가되었습니다. 다음은 관련 링크입니다: 구체적으로 Facebook이 개발한 Wav2Vec 2.0이 추가되었는데, Wav2Vec 2.0은 대량의 라벨링 없는 데이터로 unsupervised learning을 먼저 하고, 매우…
통합 자연어 처리 패키지로 유명한 HuggingFace에 음성 인식 기능이 추가되었습니다. 다음은 관련 링크입니다: 구체적으로 Facebook이 개발한 Wav2Vec 2.0이 추가되었는데, Wav2Vec 2.0은 대량의 라벨링 없는 데이터로 unsupervised learning을 먼저 하고, 매우…
한 장의 사진에서 3D 모델을 만들 수 있는 기술이 MeInGame이라는 이름으로 공개되었습니다. 공개 저장소에 올라온 결과를 보면 아직 디자이너의 작업 없이 서비스에 적용되기에는 부족하지만 초기 모델링 노력을 상당 부분 절감시킬…
카카오브레인에서 다양한 자연어 태스크에 대응 가능한 통합된 형태의 자연어 프레임워크인 Pororo를 오픈소스로 공개했습니다. Pororo는 Platform Of neuRal mOdels for natuRal language prOcessing의 약자이며 HuggingFace와 유사한 목적이라고 생각할 수 있습니다. Pororo는…
다수의 convolution layer로 구성된 AlexNet이 등장한 이래 딥러닝 모델의 구조에 대한 많은 연구들이 있어 왔습니다. 예를 들어, Google Inception은 3×3, 5×5, 7×7 등 서로 다른 커널 크기를 갖는 convolution layer를…
딥러닝 모델의 파라미터수가 크게 증가함에 따라 학습에 필요한 메모리도 함께 늘어나고 있습니다. OpenAI의 GPT-2는 1.5B개의 파라미터들로 구성되며 Google의 mT5도 13B에 이르는 파라미터 수를 가지고 있습니다. 또한 OpenAI의 GPT-3의 파라미터 수는…
딥러닝 모델들의 크기가 기하급수적으로 증가하면서 더 이상 하나의 머신으로는 활용 가능한 수준의 학습 시간을 달성하기가 어려워지고 있습니다. 잘 알려진 대화 모델인 GPT-2는 약 1.5B개의 파라미터를 가지고 있으며 학습을 위해 8백만개의…
SuperGLUE는 다양한 자연어 이해 task에 대해 AI 기술의 성능을 평가하는 챌린지입니다. 기존 GLUE에 비해 상대적으로 난이도가 높은 task들로 구성되어 있는 것이 특징인데, 최근 Microsoft에서 발표한 DeBERTa 모델이 SOTA(state-of-the-arts)를 달성했으며, 평가…
KoChat은 고현웅님이 공개한 한국어 오픈소스 챗봇 프레임워크입니다. 다음은 KoChat github 저장소입니다: 흔히 챗봇이라고 하면 대화 모델만을 생각하는 경우가 많지만, 사실 챗봇이라는 제품 관점에서 보면 머신러닝 알고리즘이 차지하는 부분은 일부분에 불과합니다.…