AI와 컴퓨터 비전 생태계에서 주석이 되는 이미지들은 훈련 알고리즘에게 중요한 역할을 한다. 다양한 이미지 처리 기술 중에서 이미지 세그멘테이션은 머신러닝 모델이 복잡한 비쥬얼 데이터를 높은 정밀도로 이해하고 해석할 수 있게 도와 주는 강력한 기술로 떠오르고 있다. 이 기능을 달성하기 위해 이미지 세그멘테이션은 특정 데이터 애플리케이션에 맞게 시맨틱 세그멘테이션 (semantic segmentation), 인스턴스 세그멘테이션 (instance segmentation), 퍼납틱 세그멘테이션 (panoptic segmentation) 세 가지 유형으로 구분된다. 이 블로그에서는 이 세 가지 유형별도 정의, 이점, 주요 차이점 및 애플리케이션을 상세 살펴보겠다.
이미지 세그멘테이션은 무엇인가?
이미지 세그멘테이션은 색상, 강도, 질감 또는 모션과 같은 특성을 기반으로 이미지를 여러 세그먼트 또는 영역으로 구분하는 컴퓨터 비전 기술이다. 이미지 세그멘테이션의 목적은 이미지를 의미 있는 부분으로 분할함으로 이미지 표현을 단순화하여 분석하고 이해하기 쉽게 만드는 것이다. 결과로 이미지 세그멘테이션 태스크 아웃풋은 세그멘테이션 마스크라고 불리는 새로운 이미지가 나온다. 고양이와 개가 함께 있는 사진이 있다고 상상해 봅시다. 이미지 세그멘테이션에는 여려가지 애플리케이션이 있다. 예를 들어 자율주행 분야에서 차선, 차량, 보행자를 구별하는 데 활용될 수 있다. 이미지 세그멘테이션은 전체 이미지를 처리하는 것이 아니라 고양이와 개를 별도 오브젝트로 식별할 것이다.
더 알아보기: 데이터 어노테이션은 무엇일까요?
이미지 세그멘테이션 기술 알아보기
이미지 세그멘테이션은 3가지 유형을 구분할 수 있다:
- 시맨틱 세그멘테이션
- 인스턴스 세그멘테이션
- 퍼납틱 세그멘테이션
3가지 유형을 아래 상세 확인할 수 있다
시맨틱 세그멘테이션 | 인스턴스 세그멘테이션 | 퍼납틱 세그멘테이션 | |
설명 | 이미지 내에 해당 클래스 레이블을 각각 픽셀에게 주석하여 시멘틱 의미를 기반으로 유사한 픽셀을 그룹화한다. | 클래스로 픽셀에 레이블을 주석할 뿐만 아니라 동일한 클래스의 개체를 구별한다. | 시맨틱과 인스턴스 세그멘테이션의 장점을 결합하는 것을 목표로 한다. 이 접근 방식은 장면 시맨틱 이해와 개별 개체 인식 사이의 격차를 해소함으로 포괄적인 장면 이해가 필요한 태스크에 유용하다. |
결과 | 각 픽셀은 특정 클래스에 해당하다 | 클래스의 각 인스턴스를 위한 고유한 레이블을 사용하여 픽셀 수준 을 기반으로 세그멘테이션을 제공한다. | 이미지는 일관된 의미 영역과 클래스의 개별 인스턴스로 세그멘테이션을 제공한다. |
비용 | 각 픽셀을 하나의 카테고리만 분류함으로 최소 비용을 요구한다. | 개별 개체를 구별하기 위해 프로세싱 노력을 요구한다. | 가장 복잡하고 가장 높은 비용을 요구한다. |
대상 프로젝트 | 시맨틱 세그멘테이션은 우선적으로 장면 이해, 객체 분류 및 이미지 주석이 필요한 프로젝트를 대상으로 한다. 이는 장면 분석, 시맨틱 이미지 라벨링, 시맨틱 내용을 통한 이미지 분류 등과 같은 작업을 포함한다. | 인스턴스 세그멘테이션은 정확한 객체 설계 및 인스턴스 수준 분석이 필요한 프로젝트에 맞게 조정된다. 작업은 객체 인식, 인스턴스 카운팅, 객체 트랙킹, 그리고 동일한 클래스의 객체가 인스턴스 수준에서 구별되는 데에 시멘틱 인스턴스 세그멘테이션과 같은 태스크를 포함한다. | 퍼납틱 세그멘테이션은 전체 장면 이해, 동시 객체 인식과 시멘틱 분석이 필요한 프로젝트를 위해 설계된다. 시맨틱과 인스턴스 세그멘테이션의 단점을 방지할 수 있다. 따라서 최대 100% 고정밀 정확도가 요구되는 프로젝트에게 데이터 어노테이션 방식으로 활용된다. 퍼납틱 세그멘테이션은 자율주행차 프로젝트에서 주변 환경을 인식하고 빠르고 안전한 결정을 내리기 위해 널리 응용되고 있다. |
예시 | 시맨틱 세그멘테이션을 나무와 차량이 있는 거리 이미지에서 활용하면 이 기술은 모든 유형의 나무를 하나의 클래스(나무)로 주석하고 모든 유형의 차량(자동차, 오토바이, 버스)을 하나의 클래스(차량)로 주석할 것이다. | 인스턴스 세그멘테이션은 거리 이미지 에 나오는 수많은 자동차처럼 클래스의 다양한 인스턴스를 인식하는 데 도움이 된다. | 특정 클래스(도로, 보도, 나무) 세그멘테이션과 한 클래스의 인스턴스를 결합한다. |
제한 | 이 방식은 특정 요구 사항의 복잡한 이미지에 대한 세부 정보를 제공하지 않는다. | 인스턴스 세그멘테이션은 서로 가려지거나 겹치는 객체를 정확하게 분할하는 데 어려움을 겪을 수 있다. | 시맨틱과 인스턴스 세그멘테이션을 위한 작업 노력이 필요하다. |
일반적인 기술 | – Fully Convolutional Networks (FCN) – U-Net – DeepLab | – Mask R-CNN – FCN with object detection heads | – Panoptic FPN – Panoptic-DeepLab Panoptic -Segmentation Module (PSM) |
이미지 세그멘테이션 실제 응용
자율주행
이 산업은 인간의 안전에 영향을 직접 미치기 때문에 정확하게 주석이 되는 데이터가 필요하다. 이미지 세그멘테이션을 요구하는 데이터 어노테이션 프로젝트는 레벨 6 자율주행 상황에서 크게 확장되고 있다. 아래는 몇 가지 일반 응용이다:
- 도로 장면 이해: 세그멘테이션은 차선, 차량, 보행자, 교통 표지판과 같은 객체를 분리하여 도로 장면을 이해하는 데 활용된다. 자율주행차가 안전히 주행하게 하는 중요한 요소이다.
- 장애물 인식: 환경의 객체를 분할함으로써 자율주행차는 경로에 있는 장애물을 인식하고 충돌을 피하기 위해 적절한 조치를 취할 수 있다.
의료
의료 이미지에는 복잡한 세부 정보가 많이 포함되어 있는 경우가 많다. 이미지 세그멘테이션 기술은 장기, 조직, 병변 등 의사가 관심을 두는 특정 영역을 분리하는 데 도움이 된다. 이를 통해 분석과 진단을 집중할 수 있다.
- 종양 탐지 및 분석: 이미지 세그멘테이션은 MRI, CT 스캔, X-rays와 같은 의료 이미지에서 종양을 식별하는 데 중요하다. 종양의 크기, 모양, 위치를 분석하여 진단 및 치료 계획을 세우는 데 도움이 되는 것이다.
- 장기 세그멘테이션: 세그멘테이션은 장기나 조직을 정확하게 분리하는 응용에 하나 기술이다. 신경 연구를 위한 뇌 분할이나 심장 분석을 위한 심장 분할 등과 같은 예를 들 수 있다.
위성 이미지
항공의 이미지는 지구를 공전하는 위성에서 지구 표면 이미지를 캡처한다. 이러한 이미지는 지구의 육지, 바다, 대기, 인간 활동을 포함한 광범위한 지역에 대한 귀중한 정보를 제공한다. 따라서 이미지 세그멘테이션은 다음과 같은 특정 애플리케이션을 통해 이 변화의 대규모로 탐지 및 분석을 도움이 된다:
- 토양 분류: 위성 이미지는 숲, 수역, 도시, 농경지 등 다양한 토지 피복 유형을 분류하기 위해 세그멘테이션을 활용할 수 있다. 이 정보는 환경 모니터링, 도시 계획, 농업 관리에 유용하다.
- 재해 관리: 세그멘테이션은 위성 이미지 분석을 통해 홍수, 산불, 지진과 같은 자연 재해의 정도를 식별하고 평가하는 역할을 맡는다. 이를 통해 효율적인 재해 대응 및 극복 노력을 준비할 수 있다.
보안 및 감시
이미지 세그멘테이션 유형은 감시 영상에서 물체나 사람을 감지하고 감찰할 수 있으므로 보안 시스템이 활동을 실시간으로 모니터링하고 분석할 수 있다. 이를 통해 잠재적인 위협이나 침입을 즉시 인식할 수 있다. 이는 다음을 포함하여 다양한 중요한 기능의 기반을 제공한다:
- 침입 감지: 이미지 세그멘테이션은 배경에서 움직이는 물체를 분할하여 보안 카메라 영상에서 의심적인 활동이나 침입자를 인식할 수 있다.
- 군중 분석: 세그멘테이션은 감시 및 공공 안전 강화를 위해 군중 행동 분석하고 사람 수를 세고 혼잡한 경우에 이상적인 현상을 감지하는 데 활용될 수 있다.
소매 및 전자상거래
소매산업에서 이미지 세그멘테이션 도입 확장은 제품 인식, 재고 관리, 고객 사로잡기와 같은 태스크에 중요한 역할을 맡고 있다.
- 제품 분류: 이미지 세그멘테이션을 활용하면 전자상거래 플랫폼에서 의류부터 전자제품, 액세서리까지 다양한 제품을 효율적으로 분류할 수 있는 경우가 있다. 이 기술은 추천과 타겟 광고를 개인화 과정에게 도움이 될 수 있다.
- 객체 추적 및 감지: 이미지 세그멘테이션을 활용하면 효율적인 판매대 관리가 이루어지며 개별 품목을 실시간으로 추적하고 최적의 재고 수준을 유지할 것이다.
- 고객 행위 인사이트: 이미지 세그멘테이션은 고객 흐름 패턴과 제품 상호 작용에 대한 인사이트를 얻고 매장 배치 최적화를 위한 데이터 기반 결정을 지원할 수 있다.
산업 검사 및 품질 관리
제조 및 산업 환경에서 이미지 세그멘테이션은 품질 관리, 오류 감지 및 프로세스 최적화를 담당한다.
- 오류 감지: 이미지 세그멘테이션을 통해 제조업체들이 제조된 제품의 오류를 정확하게 식별하고 전체 품질에게 미치는 영향을 평가할 수 있다.
- 결함 감지 및 분류: 세그멘테이션 기술은 자동차 부품, 전자 부품, 소비재 등 다양한 제품의 결함 식별 및 분류를 지원하여 생산 프로세스를 최적화할 것이다.
이미지 세그멘테이션 다양한 유형부터 강력한 임팩트까지
복잡한 IT 이슈와 경쟁적인 IT 상황은 전 세계적으로 다양한 기술 생태계를 촉진하고 있다. 위에서 언급한 세 가지 유형의 이미지 세그멘테이션 외에도 ADAS부터 소매 및 의료 분야까지 관련 프로젝트에서 바운딩 박스, 폴리곤, LiDAR 포인트 클라우드 와 같은 유형을 결합할 수 있다. 다만, 고품질 이미지 세그멘테이션은 값비싼 예산과 숙련된 인력을 요구하는 복잡한 방식이다. 신뢰할 수 있고 다양한 겸험을 보유하고 있는 파트너를 선택하는 것이 중요하다.
더 알아보기 “최고의 데이터 어노테이션 아웃소싱 업체를 선정하는 방법은 무엇일까요?“
7년 이상의 경험을 바탕으로 Qualcomm 및 LG와 같은 대업체와 협업을 통해 LTS GDS는 다양한 분야에 걸쳐 1,500만 개의 데이터 포인트를 처리해 온다. 자율주행차부터 제조업까지 우리 팀은 고객사의 프로젝트 힘을 실어 준다. 이미지 세그멘테이션의 힘을 발휘할 준비가 되시는가? 우리에게 바로 연락하십시오!