Text Annotation

소비패턴 분석을 위한 실소비 기반 라벨링 데이터 가공기

소비자의 실소비를 바탕으로 소비패턴을 분석하기 위한 텍스트 데이터 라벨링 수행기

post
icon
Overview

고객사 서비스 소개

너무나도 많은 금융기관과 금융상품들 사이에서 혼란스러우셨던 적 없으신가요?
어떤 상품이 나에게 가장 큰 혜택을 가져다 줄지 어떻게 알 수 있을까요?
무분별한 광고성 추천이 아닌 객관적으로 믿을 만한 정보를 제공받을 수 있는 곳이 있을까요?

고객들의 실소비 정보를 바탕으로 이용자에게 맞춤 금융상품을 추천하는 B사가 데이터메이커를 찾아주셨습니다.
대량의 금융 혜택 데이터와 실소비 패턴 데이터를 바탕으로 고객 개개인에게 맞춤화 된 금융 서비스를 제공하는 클라이언트 B사와 함께한 수행기입니다.

check 산업분류: 금융, IT

check 데이터량: 텍스트데이터 120만건

check 가공난이도:

slide
slide
slide
slide
icon
Problem

고객사가 겪던 문제

금융상품의 수가 워낙 방대하고, 특정 금융기관의 홍보를 목적으로 작성한 글이나 어플리케이션이 넘쳐나는 시장에서
B사는 보다 정확하고 객관적인 정보를 고객에게 전달하기 위해 기술 개발이 필요했습니다.  
이는 곧 데이터 가공에 대한 의뢰로 이어졌습니다.
도합 300만 건이 넘는 대량의 데이터 가공이 필요했기에, 자체적인 가공이 아닌 데이터메이커의 텍스트 라벨링 서비스를 찾게 되었습니다.

icon
Solution

데이터메이커 솔루션

클라이언트 B사는 4단계에 거친 세부적인 라벨링을 요청하셨습니다.
요청에 맞는 데이터 라벨링을 진행하기 위해서  최대한 효율적이고 적합한 툴을 개발하였습니다.
툴은 아래 사진과 같이 시각적, 구조적인 단계별로 구분되도록 하여 작업자들이 해당 작업의 목적을 더욱 수월히 달성할 수 있도록 하였습니다. 
또한 방대한 양의 데이터를 빠른 시일내에 가공해야 했기 때문에,  키워딩 방식을 접목하여 작업자들의 작업물들이 단지 그 작업물에만 머무르지 않고 데이터 셋에 축적되도록 하는 방식을 고안했습니다. 
작업자가 라벨링을 함에 있어 유의미한 특정 키워드를 표시하도록 하여 키워드와 라벨링 태그간의 관계에 대한 데이터 축적하고, 매칭 건수가 일정 수준 이상을 넘어설 때 해당 키워드를 가진 텍스트 데이터에는 최우선적으로 해당 태그가 추천되도록 하였습니다. 
이 방식은 추후 빠른 속도를 유지하는 것은 물론 오류율을 낮추고 정확도를 높이는데 큰 기여를 했습니다.

데이터 전달 형식에 있어서도 충분한 조율을 통해 클라이언트께서 데이터를 활용함에 있어 가장 효율적인 방식으로 전달 해드리려 노력했습니다.
대량의 데이터를 기반으로 고객에게 더욱 객관적인 정보를 제공해야하는 클라이언트께서는 빠른 작업과 고객사의 기준이 잘 반영된 작업물에 상당히 만족해하셨습니다.

staff

정사도

Project Manager

icon
Workforce

작업자 선발

유능한 작업자 선발을 위해서 이력서 평가와 유선으로 진행된 비대면 면담으로 1차로 작업자를 선발하고  대면 면접을 진행하는 2차 선발과정을 거쳤습니다.
3일의 교육 및 수습기간에는 지속적으로 프로젝트 매니저가 작업자에게 클라이언트의 기준과 요청사항을  충분히 숙지할 수 있도록 피드백을 주어 고품질 데이터를 생산할 수 있도록 준비하였습니다.
수습 기간을 거친 작업자들은 본격적으로 텍스트 분류 라벨링 작업에 착수하였습니다.
텍스트 라벨링의 경우 클라이언트의 기준에 적합한 데이터를 분류하는 것이 중요하기에, 작업물을 고객사에 전달하고 피드백과 작업 및 검수 기준에 대하여
슬랙, 구글 스프레드 시트 등 다양한 채널을 통해 클라이언트와 소통하며 지속적으로 조율하였습니다.

grid
grid

저희 데이터메이커는 글로벌 데이터 가공 플랫폼입니다.
높은 보안을 갖춘 환경 속에서 작업한 우수한 품질의 학습 데이터를 업계 최저 가격에 제공합니다.
저희는 진심을 담아 고객사에게 최고의 품질의 데이터로 돌려드립니다.

logo-datamaker

With datamaker

Get Started Today
with datamaker.

high_five