GAN 모델의 해석 가능한 제어 방법 (GANSpace)
딥러닝 기반의 이미지 생성 방법으로서 GAN은 놀라운 결과들을 많이 만들어내고 있습니다. 특히 학습 후 latent vector를 변경함으로써 다수의 유의미한 의미를 갖는 변화를 만들 수 있기 때문에, latent space가 단순히 랜덤한…
딥러닝 기반의 이미지 생성 방법으로서 GAN은 놀라운 결과들을 많이 만들어내고 있습니다. 특히 학습 후 latent vector를 변경함으로써 다수의 유의미한 의미를 갖는 변화를 만들 수 있기 때문에, latent space가 단순히 랜덤한…
Tensorflow Lite는 Tensorflow로 학습된 AI 모델들을 모바일 기기에서 동작시킬 수 있도록 해 주는 도구들을 포함하고 있는 소프트웨어 패키지입니다. 현재 40억개 이상의 기기에서 동작하고 있다고 합니다. 기본적으로 학습된 모델을 Tensorflow Lite…
Avatarify는 Zoom, Teams, Hangout, Skype등 다양한 화상통신 프로그램에 실시간 아바타 애니메이션 기능을 추가해주는 프로그램으로, 오픈소스로 공개되어 있습니다. 화상통신 프로그램의 카메라 입력을 대치하는 형태로 개발되어 있으며, 알고리즘은 first-order motion model을 사용합니다.…
한 장의 사진에서 3D 모델을 만들 수 있는 기술이 MeInGame이라는 이름으로 공개되었습니다. 공개 저장소에 올라온 결과를 보면 아직 디자이너의 작업 없이 서비스에 적용되기에는 부족하지만 초기 모델링 노력을 상당 부분 절감시킬…
다수의 convolution layer로 구성된 AlexNet이 등장한 이래 딥러닝 모델의 구조에 대한 많은 연구들이 있어 왔습니다. 예를 들어, Google Inception은 3×3, 5×5, 7×7 등 서로 다른 커널 크기를 갖는 convolution layer를…
OpenAI가 발표한 DALL-E는 자연어 텍스트로부터 이미지를 생성하는 기술입니다. 기존에도 StackGAN이나 OP-GAN 등 같은 목적의 기술들이 있었지만 DALL-E는 초대규모 언어 모델인 GPT-3 기반으로 만들어져서 최종 결과물의 품질이 월등히 우수하다는 장점이 있습니다.…
FrankMocap은 Facebook AI Research(FAIR)에서 공개한 기술로서 한 장의 이미지, 혹은 동영상에서 3D 모델을 위한 포즈를 추출해내는 역할을 합니다. 특히, 바디 뿐 아니라 손 모양까지 함께 추정할 수 있다는 것이 특징이라고…
StudioGAN은 포항공대 CVLab 강민국님께서 공개하신 pytorch 기반의 오픈소스 라이브러리로서 다양한 GAN 알고리즘들이 구현되어 있습니다. 포함되어 있는 GAN 알고리즘에는 DCGAN, LSGAN, WGAN 등 주요 알고리즘들이 다수 포함되어 있어 상호 성능 비교 등…