데이터 어노테이션은 무엇일까요?
데이터(사진, 동영상, 텍스트, 오디오)를 라벨링하는 과정은 데이터 어노테이션으로 머신러닝 모델들이 자신이 무엇인지 인식하고 이해한 후 앞으로 활용하여 예측을 생성을 시키는 데에 도움이 됩니다.
데이터 어노테이션은 왜 필요할까요?
주석된 데이터는 머신러닝 감찰하기 위해 필수적입니다. 왜냐하면 실제로 ML 모델이 객체 인식 및 결정수립과정을 위한 주석된 데이터 큰 수량이 필요하기 때문입니다. 이는 주석된 데이터의 품질이 결정의 정확성과 관련성을 보장하는 핵심 요소 중 하나가 될 이유입니다.
데이터 유형
이미지, 동영상, 텍스트, 오디오, 3D 센서 데이터 등 다양한 데이터 유형이 있습니다.
이미지
사람, 사물, 동물의 이미지입니다. 이 유형은 많은 프로젝트에서 높은 숫자를 가지고 있습니다. 자율주행 또는 자동화 의료 같은 산업은 수많은 이미지 주석을 필요로 합니다. 효율적이고 정확한 주석으로 인공지능 시스템은 인간의 상호작용 없이 완전하게 운영하도록 훈련된 사진으로부터 습득할 수 있습니다.
동영상
CCTV 또는 카메라로부터의 테이프 기록으로서 전형적으로 장면들로 분할됩니다. 이미지들과 비교하여 연속적인 이미지들의 시퀀스이고 각각의 이미지는 이전 것과 약간 변화만을 가질 것으므로 라벨러가 비디오 프레임에서 움직임의 연속성을 보여주기 위해 신중하고 정확하게 주석할 것을 요구합니다.
텍스트
여러 가지 언어로 문서나 단어, 숫자입니다. 단어, 구, 문장에 대한 레이블을 붙임으로써 머신 러닝은 내용을 이해할 수 있을 뿐만 아니라 사람 성명, 국가 이름, 심지어 자연어 처리(NLP)에 널리 적용되는 정과 태도 등과 같은 대상이 되는 내용을 식별할 수 있습니다.
오디오
다른 인구통계학을 가진 개인들이 만든 오디오 녹음입니다. 소리로 만들어진 어떤 오디오 녹음도 추가적인 키노트와 관련 정보를 가질 수 있습니다. 오디오는 울음소리, 비명, 총소리와 같은 다양한 종류의 소음과 소리도 될 수 있습니다. 음성 인공지능 분야에서 많이 연구되고 적용되어 왔습니다.
3D 센서 데이터
센서 장치에 의해 생성된 3D 모델입니다. 3D 센서로부터 수집되는 데이터의 유형은 기존의 카메라의 데이터보다 복잡한 경우가 많습니다. 3D 센서는 적외선 광원을 사용하기 때문에 어두운 곳에서도 작동할 수 있습니다. 게다가, 3D 센서는 카메라보다 물체의 크기를 더 정확하게 추정할 수 있다는 것으로 나타났습니다.
데이터 어노테이션 유형
여러가지 프로젝트에서 데이터 주석의 유형은 매우 다양합니다. 유형은 어떤 객체를 인식해야 하는지 또는 고객사의 요청에 따라 달라집니다. 데이터 주석의 종류를 정의하기 위해 데이터 유형과 툴 를 기반으로 합니다.
바운딩 박스
작업자들이 물체 주변에 사각형을 그리기 위해 바운딩 박스를 사용합니다. 바운딩 박스는 주석된 물체의 가장 바깥쪽 점을 둘러쌀 필요가 있습니다. 물체를 감지하고 자동차나 사람과 같은 물체의 위치를 분류하는 데 활용됩니다. 이 유형은 가장 간단하고 신속한 진행 방법입니다.
폴리곤
인체, 로고 또는 도로 표지판과 같은 불규칙한 물체에 대한 더 정확한 결과를 원한다면, 폴리곤으로 작업하는 것이 좋습니다. 물체 주변에 그려진 경계는 물체의 모양과 크기의 정확한 그림을 보여주고 머신이 아웃풋을 더 정확하게 예측할 수 있게 합니다.
폴리라인 & 스플라인
정점에서 연결된 작은 라인을 사용하여 만들어 집니다. 작업자들이 도로, 레일 트랙, 파이프라인과 같은 이미지와 비디오의 선형 구조를 정의하기 위해 이를 적용합니다. 이 유형은 예를 들어 자동화된 차량에 대한 모델을 머신이 학습하여 차선을 감지하고 올바른 차선을 식별할 수 있도록 합니다.
3D 직육면체
2D 이미지 안에 객체를 둘러싸고 있는 큐브는 그 객체의 깊이를 결정하는 목표로 합니다. 3D 큐브로이드는 장애물을 측정하고 간격을 계산하는 데 도움을 줄 수 있는 자율주행 기술에 널리 활용되고 있습니다.
시맨틱 세그멘테이션
동일한 클래스에 속하는 모든 픽셀을 인식하기 위해 이미지의 모든 픽셀에 레이블이나 범주를 연관시키는 작업입니다. 이 작업을 진행하면 머신 러닝 알고리즘이 특정된 특징을 분류하는 데 도움이 됩니다. 예를 들어 시맨틱 분할은 부족하거나 재료 낭비를 발견하기 위한 산업 검사에 활용됩니다.
랜드마크
랜드마크(keypoint) 주석은 얼굴, 신체의 핵심 포인트 위치들을 가리키는 프로세스입니다. 이러한 유형의 작업은 스포츠 모션 트래킹 및 얼굴에 제스처와 감정을 인식하는데 유용합니다. 주석자들은 랜드마크 주석만을 사용하거나 다른 유형의 데이터 주석과 결합하여 사람들의 포즈를 정의하는 포인트 맵을 만들 수 있습니다.
LiDAR 포인트 클라우드
센서와 대상 객체 사이의 간격을 측정하기 위해 레이저 펄스 형태의 빛을 이용하는 리모우트 감지 기술입니다. 포인트 클라우드 이미지의 대상 객체는 프로젝트 요구 사항에 따라 바운딩 박스, 3D큐보이드 등 주석될 수 있습니다. 이런 유형은 다양한 산업 분야에 적용되고 있는데, 가장 눈에 띄는 산업은 자율주행입니다.
데이터 어노테이션을 위한 일반전인 툴
데이터 주석 프로세스에서 더 쉽게 작업할 수 있도록 지원하는 툴이 있습니다.
- Labellmg
- GIMP
- CVAT
- Label Studio
- V7
- LTS Annotation
- Super Annotate
- RectLabel
- Basic AI
- ViTBAT
데이터 어노테이션 작업의 3단계
첫 번째 단계: 데이터 수집
데이터 수집은 특정한 목적을 위해 여러 출처에서 정보를 수집, 측정, 분석하는 과정입니다. 데이터를 수집하는 방식에는 여러 가지가 있습니다.글에서 키워드를 검색해 보고 사진, 동영상을 저장할 수 있습니다. 그 외에도 외부에서 자료를 구입하거나 공중 카메라에서 자료를 취득할 수 있습니다. 또 이미지를 찍거나 오디오를 녹음하거나 비디오를 녹화하여 자료를 스스로 수집할 수 있다. 자료를 수집하기 위해 정보의 요구를 충족시키기 위해 자료의 유형 및 수집 방식을 파악할 필요합니다. 무엇보다 다양한 프로젝트에서 완성도의 품질에 초점을 두어야 합니다.
두 번째 단계: 이슈 분류
기술을 선택하기 전에 수집된 데이터와 사용하여 이미지 분류나 객체 인식과 같은 문제의 요청 사항을 확인할 것입니다. 각 프로젝트의 문제를 명확하게 파악해야 시간과 비용을 절약하는 데 도움이 될 것입니다.
마지막 단계: 데이터 어노테이션 작업
데이터를 수집하고 문제를 파악한 후 데이터에 주석을 운영하는 단계입니다. 주석자들은 데이터 주석 유형 (바운딩 박스, 3D 직육면체, LiDAR 포인트 클라우드)을 기반으로 데이터 유형에 레이블을 붙입니다. 데이터 주석 프로세스는 일부 자동 툴로 자동으로 진행되거나 매뉴얼로 진행될 수 있는데 각 방식에는 장단점이 있을 것입니다. 예를 들어 자동적으로 적업은 더 빠른 반면에 매뉴얼 적업은 더 높은 정확도를 갖습니다.
잠재적 공급업체는 누구일까요?
많은 요인들이 데이터의 품질에 영향을 미치는데, 그중 하나가 적합한 데이터 라벨링 서비스 공급자를 선택하는 것입니다. 기업들은 온라인 데이터 주석 툴을 선택하거나 내부 직원이 담당하도록 할 수 있습니다. 그 외에 AI 기업들은 데이터 주석 서비스 제공을 전문으로 하는 아웃소싱 기업을 선택할 수 있습니다.
더 알아보기: 최고의 데이터 어노테이션 아웃소싱 업체를 선정하는 방법은 무엇일까요?
LTS GDS는 파트너를 위한 고품질과 안전한 서비스를 제공합니다. 자세한 정보를 얻기 위해 바로 연락주세요!