데이터 정형화 수행기
고객사 분들에게 최고의 결과물을 드리기까지
저희 데이터메이커가 진심으로 고민한 이야기를 들려드리고자 합니다.
세상에는 수많은 정보를 담은 데이터들이 있습니다.
그리고 가끔은 '어떤 데이터를 담고 있는가' 보다 '어떻게 담겨있는가' 가 데이터의 가치를 좌지우지 할 때가 있습니다.
데이터의 더 가치있는 쓰임을 위하여 데이터 정형화를 진행한 수행기를 들려드리고자 합니다.
1.서비스 의뢰
방대한 양의 데이터를 보유하신 클라이언트분이 데이터메이커를 방문해 주셨습니다.
다양한 경로를 통해 수집된 여러가지 데이터를 마케팅과 비즈니스 전반에 활용할 수 있는 형태로 변경해달라는 의뢰를 요청하셨습니다.
2. 파일 개봉 및 데이터 확인
저희에게 정형화를 의뢰하며 건네주신 파일은 확장자 부터 처음 보는 형식의 파일이었습니다.
<넌 누구냐>
수차례의 검색과 시행착오 끝에 수정이 가능한 형태로 파일을 변경하였습니다.
그리고 문자로만 이루어진 파일임에도 불구하고, 긴 로딩 시간 끝에 우리에게 처음으로 속내를 보여주었습니다.
<실제 파일 내용. 보호를 위하여 blur처리 되었습니다.>
인고의 시간 끝에 열린 파일은, 여러 경로에서 다양한 형태로 수집된 비정형적인 데이터의 형태를 가감없이 담고 있었습니다.
본격적인 데이터 정형화의 시작을 알리는 순간이었습니다.
3. 데이터 분석 및 형식 파악
국내외를 넘나드는 데이터 수집 방식으로 인하여 데이터는 컴퓨터가 다양한 언어의 형식으로 표현하는 '유니코드' 형태로 저장되어 있었습니다.
이를 내용 파악을 위하여 한국어와 한문으로 변경하는 과정을 가졌습니다.
다음으로는 데이터의 공통된 형식을 파악하여 틀을 제작하는 과정을 가졌습니다.
데이터메이커와 함께 하시려면..
저희 데이터메이커는 글로벌 데이터 가공 플랫폼입니다.
높은 보안을 갖춘 환경 속에서 작업한 우수한 품질의 학습 데이터를 업계 최저 가격에 제공합니다.
저희는 진심을 담아 고객사에게 최고의 품질의 데이터로 돌려드립니다.
* 가공 비용 걱정이 되시나요?
현재 2020년 한국데이터산업진흥원이 주관하는 데이터바우처 지원사업이 진행중입니다.
일반 데이터 가공의 경우 최대 4,500만원, AI 데이터 가공의 경우 최대 7,000만원까지 바우처를 지원해주고 있습니다. 저희를 공급기업(가공기업)으로 선정하여 협약하시면, 위 혜택을 받아보실 수 있으십니다.
저희가 최대한 도와드리도록 하겠습니다.