작물 병충해 바운딩박스 데이터 구축 사례

정확한 병해 진단을 위한 AI 학습 데이터셋 구축

작물병충해 자동 인식 솔루션 썸네일

프로젝트(고객사) 소개

이번 프로젝트는 농업 데이터 기반 AI 기술을 개발 중인 고객사와 함께 진행한 데이터 구축 사례입니다. 고객사는 작물 병해충 진단 및 처방 기술을 활용해 농자재 유통을 지원하는 AI 기반 플랫폼을 개발 중이었으며, 병해충을 정확히 진단할 수 있는 AI 모델을 구현하기 위해서는 대량의 고품질 이미지 데이터와 정밀한 라벨링이 필수적이었습니다. 데이터메이커는 정적 작물 병해 이미지에 대해 시멘틱 세그멘테이션과 바운딩박스 라벨링을 병행 수행하며, AI 모델 학습에 최적화된 기반 데이터를 성공적으로 구축했습니다.

고객사의 Problem

고객사는 병해충 자동 진단 AI 모델을 개발하기 위해 약 120만 개의 객체 라벨링 데이터를 확보하는 것을 목표로 했습니다. 그러나 실제 병해가 발생한 작물을 직접 촬영하거나 수집하는 것은 현실적으로 어려웠고, AI 허브 등 외부 공개 데이터의 활용에도 한계가 있었습니다.
고객사가 직면한 주요 과제는 다음과 같았습니다:

  • 병해 부위의 형태가 불규칙하고 진행 양상이 다양해 비전문가가 정확히 판단하기 어려움
  • 고객사가 제공한 가이드라인이 학술적 성격에 가까워 작업자의 이해도에 따라 해석 차이 발생
  • 내부 라벨링 리소스 및 전문성 부족으로 대규모 작업 수행이 어려움
  • 한정된 예산 중 일부가 데이터 수집에 투입되어 전체 작업량 축소 우려
이에 고객사는 정확한 라벨링 품질과 대규모 이미지 작업 역량을 동시에 갖춘 전문 데이터 구축 파트너로서 데이터메이커를 선택하게 되었습니다.

데이터메이커의 Solution

데이터메이커는 병해충 도메인 비전문가도 정확한 작업이 가능하도록 라벨링 기준을 단순화하고 시각화하며, 라벨 품질을 확보하는 동시에 대량 작업 효율도 높일 수 있는 솔루션을 적용했습니다. 주요 솔루션은 다음과 같습니다.

  • 실행 가능한 가이드라인 재정립
    • 학술 기반의 고객 가이드를 작업자 중심으로 해석
    • 병변 진행 단계별 이미지 예시를 기반으로 작업 기준 시각화
    • 비전문 작업자가 병해 패턴을 명확히 구분할 수 있도록 가이드 제작
  • 시멘틱 세그멘테이션 및 바운딩박스 병행 작업
    • 병해 부위의 불규칙성을 반영하기 위해 폴리곤 기반 시멘틱 라벨링 수행
    • 해당 영역을 기준으로 바운딩박스 자동 생성하여 효율성 향상
  • AI 학습 최적화를 위한 이미지 증강
    • 10도 간격으로 이미지 회전하여 총 9배의 데이터 확장
    • 회전된 이미지에 자동 블랙박스 생성 처리 및 재라벨링
  • 우선순위 기반 클래스 작업 전략 적용
    • 병변 수가 많거나 판별이 용이한 클래스부터 우선 작업
    • 고난이도 이미지에 대해서는 시간 대비 효율 고려하여 작업 전략 조정

작물병충해 자동 인식 솔루션

수행 과정

본 프로젝트는 약 6개월간 진행되었으며 다음과 같은 절차로 수행되었습니다

데이터 수집 및 정제

  • AI 허브 내 공개 데이터 노지 시설 작물 질병 진단 이미지를 기반으로 가공
  • 활용 가능한 이미지 약 15000장 확보 이후 회전 증강을 통해 총 120000장 이미지 확보

작업 가이드라인 구축 및 교육

  • 병해충 진행 정도별 예시 이미지 제작
  • 병변 간 색상 구분 방식 정의 인접 병변은 다른 색으로 작업하도록 기준 설정

datamake synapse 라벨링 및 툴

  • 원본 이미지에 시멘틱 세그멘테이션 진행
  • 폴리곤 기반 병변 라벨링 후 바운딩박스 자동 생성
  • 시냅스 라벨링 툴을 사용하여 10도 단위로 이미지 회전 후 객체 검출 누락 방지를 위한 추가 라벨링 수행

작물병충해 자동 인식 솔루션

성과 및 결과

  • 총 120000장의 이미지에 대해 병해 객체 약 120만 개 라벨링 완료
  • 시멘틱 세그멘테이션 및 바운딩박스 자동 생성으로 작업 효율 9배 향상
  • 병해 부위 판별의 일관성 유지로 AI 모델 학습 정밀도 기대치 초과

프로젝트를 마치며

본 프로젝트는 병해충 진단 AI 고도화를 위한 학습 데이터 기반을 마련한 사례로 농업 AI 모델링에 있어 데이터의 질이 모델 성능을 좌우한다는 점을 명확히 보여주었습니다. 데이터메이커는 이번 프로젝트를 통해 병해충 도메인의 어려운 기준을 실무 적용 가능한 형태로 재정의하고 검수와 커뮤니케이션 중심의 협업 구조를 통해 고품질 데이터를 적기에 제공했습니다. 앞으로도 데이터메이커는 AI 개발 기업들이 데이터 구축 단계에서 겪는 시행착오를 줄이고 정확하고 유연한 데이터셋을 통해 AI 기술의 실현 가능성을 높이는 조력자로 함께하겠습니다.

연관 아티클

LLM 기반 금융 이용 내역 자동 분류 시스템 구축

개인화된 예산 관리와 안전한 데이터 활용을 지원하는 AI 솔루션을 구축

스마트 양식장 생장 예측 솔루션

양식장의 변화를 이끄는 AI, 생산성도 데이터로 결정된다

드론 촬영 이미지 기반 농작물 모니터링

정밀 농업을 위한 AI 학습 데이터셋 구축

LLM 학습을 위한 수학 문제 데이터 구축 수행기

교재 기반 수학 문제를 정형 데이터로 가공해 LLM 학습에 최적화한 데이터셋 구축 수행기

무인기 기반 객체 인식을 위한 AI 모델 개발

드론 영상 기반 객체 탐지 데이터셋 구축 및 AI 온디바이스 모델 개발 수행기

가려진 객체 인식 자동화 솔루션

영상 내 가려진 객체에 대한 라벨링을 하여 데이터셋을 구축하였습니다.