Project Review

소비패턴 분석을 위한 실소비 기반 라벨링 데이터 가공기

 고객사 분들에게 최고의 결과물을 드리기까지
저희
데이터메이커가 진심으로 고민한 이야기를 들려드리고자 합니다.

 


 

고객과 서비스 소개

 

너무나도 많은 금융기관과 금융상품들 사이에서 혼란스러우셨던 적 없으신가요?
어떤 상품이 나에게 가장 큰 혜택을 가져다 줄지 어떻게 알 수 있을까요?
무분별한 광고성 추천이 아닌 객관적으로 믿을 만한 정보를 제공받을 수 있는 곳이 있을까요?

 

고객들의 실소비 정보를 바탕으로 이용자에게 맞춤 금융상품을 추천하는 B사 데이터메이커를 찾아주셨습니다.
대량의 금융 혜택 데이터와 실소비 패턴 데이터를 바탕으로 고객 개개인에게 맞춤화 된 금융 서비스를 제공하는 클라이언트 B사와 함께한 수행기입니다.

 

 

금융상품의 수가 워낙 방대하고, 특정 금융기관의 홍보를 목적으로 작성한 글이나 어플리케이션이 넘쳐나는 시장에서
B사는 보다 정확하고 객관적인 정보를 고객에게 전달하기 위해 기술 개발이 필요했습니다.  
이는 곧 데이터 가공에 대한 의뢰로 이어졌습니다.
도합 300만 건이 넘는 대량의 데이터 가공이 필요했기에, 자체적인 가공이 아닌
데이터메이커의 텍스트 라벨링 서비스를 찾게 되었습니다.

 

 

데이터 가공 수행

 

 

 

커스텀 툴 개발

 

클라이언트 B사는 4단계에 거친 세부적인 라벨링을 요청하셨습니다.
요청에 맞는 데이터 라벨링을 진행하기 위해서  최대한 효율적이고 적합한 툴을 개발하였습니다.
툴은 아래 사진과 같이 시각적, 구조적인 단계별로 구분되도록 하여 작업자들이 해당 작업의 목적을 더욱 수월히 달성할 수 있도록 하였습니다. 

또한 방대한 양의 데이터를 빠른 시일내에 가공해야 했기 때문에,  키워딩 방식을 접목하여 작업자들의 작업물들이 단지 그 작업물에만 머무르지 않고 데이터 셋에 축적되도록 하는 방식을 고안했습니다. 
작업자가 라벨링을 함에 있어 유의미한 특정 키워드를 표시하도록 하여 키워드와 라벨링 태그간의 관계에 대한 데이터 축적하고, 매칭 건수가 일정 수준 이상을 넘어설 때 해당 키워드를 가진 텍스트 데이터에는 최우선적으로 해당 태그가 추천되도록 하였습니다. 

 

이 방식은 추후 빠른 속도를 유지하는 것은 물론 오류율을 낮추고 정확도를 높이는데 큰 기여를 했습니다.

 

 

작업자 선발 및 교육

 

유능한 작업자 선발을 위해서 이력서 평가와 유선으로 진행된 비대면 면담으로 1차로 작업자를 선발하고  대면 면접을 진행하는 2차 선발과정을 거쳤습니다.

3일의 교육 및 수습기간에는 지속적으로 프로젝트 매니저가 작업자에게 클라이언트의 기준과 요청사항을  충분히 숙지할 수 있도록 피드백을 주어 고품질 데이터를 생산할 수 있도록 준비하였습니다.

 

 

텍스트 라벨링 작업 및 1차 검수

 

수습 기간을 거친 작업자들은 본격적으로 텍스트 분류 라벨링 작업에 착수하였습니다.
텍스트 라벨링의 경우 클라이언트의 기준에 적합한 데이터를 분류하는 것이 중요하기에, 작업물을 고객사에 전달하고 피드백과 작업 및 검수 기준에 대하여
슬랙
, 구글 스프레드 시트 등 다양한 채널을 통해 클라이언트와 소통하며 지속적으로 조율하였습니다.

프로젝트 매니저는 해당 사항들은 최대한 빠르게 작업자들에게 전달하고 이후 작업에 있어 반영될 수 있도록 하였습니다.
특히 검수자와 고객사가 직접 소통할 수 있는 채널을 마련하여 클라이언트의 피드백에 한층 더 민감하게 대응 할 수 있도록 하였습니다.

 

                                               <납품 데이터에 대한 추가 요청사항 전달>

 

 

라벨링 작업 마무리 및 2차 검수

 

작업이 마무리 된 후 데이터 라벨링 작업 기간 동안에 우수한 작업태도와 퀄리티를 보여준 작업자들을 선별하여 2중 검수를 진행하였습니다.
텍스트 라벨링 작업 특성상 약간의 주관적인 판단들이 개입될 수 있고, 그렇기에 작업물 사이에 존재하는 미세한 간극을 위 방식을 통해 줄일 수 있었습니다.

또한 검수들이 세부태그에 대해 잘 이해할 수 있도록 지속적인 교육을 수행하였고, 검수자들 개개인의 역량을 반영하여 적합한 분야에 배정하였습니다.
이를 통해 검수자가 해당 분야의 데이터를 더욱 정확하고 전문적으로 검수할 수 있도록 하여 작업물의 퀄리티가 높아졌습니다.

 

 

납품

 

데이터를 한번에 납품하지 않고 일정주기로 납품함으로써 지속적인  피드백 과정을 거치면서 프로젝트를 진행하였습니다.
데이터 전달 형식에 있어서도 충분한 조율을 통해 클라이언트께서 데이터를 활용함에 있어 가장 효율적인 방식으로 전달 해드리려 노력했습니다.
대량의 데이터를 기반으로 고객에게 더욱 객관적인 정보를 제공해야하는 클라이언트께서는 빠른 작업과 고객사의 기준이 잘 반영된 작업물에 상당히 만족해하셨습니다.

 


 


 

데이터메이커와 함께 하시려면..

저희 데이터메이커는 글로벌 데이터 가공 플랫폼입니다.

높은 보안을 갖춘 환경 속에서 작업한 우수한 품질의 학습 데이터를 업계 최저 가격에 제공합니다.

저희는 진심을 담아 고객사에게 최고의 품질의 데이터로 돌려드립니다.

데이터메이커 바로가기

 

 

가공 비용 걱정이 되시나요?

현재 2021년 한국데이터산업진흥원이 주관하는 데이터바우처 지원사업이 진행 중입니다.

일반 데이터 가공의 경우 최대 4,500만원 , AI 데이터 가공의 경우 최대 7,000만원 까지 바우처를 지원해주고 있습니다.

저희를 공급기업(가공기업)으로 선정하여 협약하시면, 위 혜택을 받아보실 수 있으십니다.

저희가 최대한 도와드리도록 하겠습니다.

데이터바우처 지원 사업 더 알아보기

 

Get Started Today
with datamaker

데이터메이커 시냅스를 회사에 도입하고 싶으시다면,
아래 의뢰하기 버튼을 눌러주세요!

synapse 문의하기