[Service Development Team Eunji Kwon]
영상 분할(Semantic Segmentation) 기술은 컴퓨터 비전 분야에서 가장 핵심적인 요소 중 하나이며, 이미지 내의 픽셀별로 해당 픽셀이 어디에 속하는지 분류하는 기술입니다. 주로 실생활에서 의료, 드론, 교통 분야에 많이 활용되며, 특히 자율 주행 자동차 기술에 많이 접목되어 있습니다. 이미지를 구성하는 각 픽셀이 어떤 클래스에 속하는지 레이블링(Labeling)을 수행하게 되는데 이는 컴퓨터 비전(Computer Vision), 센서 퓨전(Sensor Fusion) 기술로 활용됩니다.
자율 주행(Autonomous Driving) 산업에서 카메라를 통해 인식되는 다양한 객체들을 인지하고 분류하는 역할을 합니다. 그 과정은 크게 사물 인식(Perception), 위치 파악(Localization), 경로 계획(Path Planning), 기기 제어(Control) 4가지 단계로 구분됩니다. 의료 산업에서의 AI 기술은 크게 의료 데이터, 병리 영상, 신호 모니터링 3가지로 구분되어 개발되고 있습니다. 그 과정에서 영상 분할 AI 기술은 병리 영상 분야에서 정밀 진단의 핵심 요소로 사용된다고 합니다.
최근 엔비디아에서 22일(현지시간) 공개한 고갱2(GauGAN2) 베타 버전 또한 세그멘테이션(Segmentation) 맵이 사용되었습니다. 이는 이미지 복원 기술의 일종인 인페인팅(Inpainting), 텍스트 이미지 생성(Text-to-Image Generation)기술과 통합하여 사용자가 인풋 박스에 텍스트를 입력하면 사실적인 이미지 형태로 보여주게 됩니다. 현재 베타 버전으로 단어와 형용사로 생성되는 모든 이미지는 100% 만족할 수 없지만 이러한 서비스는 딥 러닝 기술을 바탕으로 더 나아질 것입니다. 지금까지 영상 분할(Semantic Segmentation) 기술 관련 해외 학술 논문은 약 2,241건입니다. 오늘날 AI 영상 기술의 파급력은 비즈니스 영역을 불문하고 매우 광범위하게 이루어지고 있으며 향후에도 기술 고도화를 통해 융복합 형태로 발전할 전망입니다.