2012년 12월 20일 목요일

비정형 데이터의 다양한 활용 방법

참으로 오랜만에 글을 올리네요.

그동안 많은 일들(?)이 있는 바람에 그리 되었으니 넓은 아량으로 이해해 주셨으면 좋겠습니다^^

오늘 말하고자 하는 주제는 비정형 텍스트 데이터에서 어떠한 트렌드를 예측하기 위한 방법에 대한 것을 말해볼까 합니다.

오늘날 가장 핫한 것이 소셜 미디어인데요.
물론 소셜 미디어도 비정형 텍스트 데이터의 하나라고 볼 수 있겠죠.
하지만, 소셜 미디어 말고도 우리 주변에는 많은 텍스트 데이터가 존재합니다.
여러분들이 직접 작성한 보고서나 고객이 불만을 접수한 내역, , 컨퍼런스 자료 등등등..
참 많죠?

...이제 몇가지 예를 들면서 재미있는 가설을 한번 세워볼까 합니다.




첫째로, 소셜미디어를 포함, 고객의 불만을 분석하여, 이것을 조기경보시스템과 연동시켜보고자 하는데요. 어떨까요?

조기경보시스템이라 함은, 기업 내에서 유통시키는 제품이나, 새로 내놓은 신제품이 있다고 가정했을 때,
제품의 특정 부분에 문제가 생김으로 발생될 수 있는 문제를 조기에 발견, 대응하고자 하는 시스템 입니다.

예를 들자면(오늘 참 예를 많이 드는군요^^), 휴대폰이 있었을 때, 특정 부품에 문제가 있어, 이 부분의 A/S가 마구 늘어나게 됩니다. 근데 이상하게, OO날짜에 만들어 진 제품만 그렇다면, 이 때 생산되어 유통시킨 제품에 대하여 어떠한 작업이 들어가야겠죠?

, 그럼 이런 조기경보시스템이 있다고 가정하고, 비정형 텍스트 데이터를 연동시켜 볼까요?

고객이 불만을 접수합니다. 아주 많은 종류의 불만들이 있을 수 있겠죠. 전화로 문의할 수도 있고, 홈페이지나 고객게시판 등 많은 채널들이 있을 것 입니다. 보통 사람들은 A/S를 받기 전에 정말 문제인 건지, 원래 그런건지 등을 확인하고자 하거든요.

이 중에서 유독 많은 불만을 차지하는 부분이 있을 텐데,
우리는 여기에서 A/S가 늘어가기 전에 이미 무언가 이상하다는 낌새를 챌 수 있는 것이죠.
이를 해결해기 위해 한발 앞서 부품의 교체나, 부품 조달 등 조치를 취할 수 있게 되는 것이죠.
역으로, 불만만 제시될 뿐, A/S가 없다면, 이건 다음 제품에서 개선되어야겠죠?


두번째로는, 기술 트렌드에 대한 예측입니다.
우리는 뉴스 매체 등에서 앞으로 뜨는 기술이다. 미래에 유망한 기술이다. 등 많은 트렌드 들을 접하고 있습니다.

그런데, 이것을 어떻게 증명할 수 있을까요?

어디까지나 제 의견이지만, 어느 정도 근거를 가지고 주장할 수는 있을 것 같다는 생각이 드네요.
~ 한번 소설을 한번 써 보도록 할까요?^^

출판되는 책들의 제목, 논문, 등록되는 특허, 정책 등 이러한 텍스트 데이터를 분석을 해 봅니다.
그러면, 공통적으로 많이 나오는 키워드가 있을 텐데, 이 키워드가 어쩌면 트렌드가 되지 않을까 싶네요.
(
이미 소설이라고 말씀을 드렸기 때문에, 데이터 분석에 있어서 검증은 필수라는 것 아시죠?^^;;, 살짝 발을 빼놔야 문제가 없기에...ㅎㅎㅎ)


분야별로 관련 된 매체를 활용하면, 기술 뿐만 아니라 다양한 분야의 트렌드 예측도 가능하지 않을까 싶습니다.


백화점을 예를 들자면, 각 매장의 판매 된 상품 코드 등을 분석해 보면 옷의 종류, 색상 등을 알 수 있을 텐데, 이는 앞으로 유행이 될 패션 트렌드가 될 가능성이 있을 수 있는 것 입니다.

그러면, 이런 정보를 입점 한 각 매장에 알려주면, 백화점 매출이 올라가는 효과를 볼 수도 있겠죠?^^
(상생 경영~ 절대 어렵지 않아요~ㅎㅎ)




이처럼, 비정형 빅데이터는 약간의 아이디어만으로도 많은 활용 방법이 있습니다.중요한 것은 분석의 기반이 되는 데이터가 어떠한 것이냐에 대한 것이 겠죠.
예전에도 말씀드렸지만, Garbage in, Garbage out 절대 잊으시면 안됩니다^^
그럼 오늘은 여기서 줄일까 해요.

다음에 또 뵈요~


- Post by Jongwook   @jwwon 팔로우하기