2012년 3월 29일 목요일

SPLUNK를 활용한 마케팅 전략 - 1. SPLUNK 소개 (1)

스플렁크(Splunk)라고 들어 보셨나요?
Splunk는 비정형 데이터를 분석하는 솔루션이구요보안/관제/모니터링 쪽에서는 그 기능성과 유연성 때문에 이미 핫이슈로 떠오른 솔루션입니다, Splunk는 비단 보안분야 뿐아니라 다양하게 응용이 가능한데요, 우리는 마케팅쪽으로 해당 솔루션을 접목해 응용해 보려 합니다. 먼저 Splunk소개부터 하겠습니다.


과거 GB(기가바이트) 단위로 처리하던 데이터가 현재에 이르러서는 PB(페가바이트) 단위로 처리해야하는 상황이 되었습니다. 마이크로 소프트 회장 빌게이츠가 개인용 데스크탑의 경우 640KB RAM이면 충분하다고 이야기 한 것이 불과 십수년 전이었던 것을 생각해보면, IT분야의 기술이란 것이 엄청나게 빠른속도로 발전하였고 그에 따른 데이터량도 어마어마 해졌다는 의미일 것입니다. 현대의 데이터량은 그야말로 기하급수적으로 늘었다고 볼수 있구요, 텍스트, 논문업무문서, 멀트미디어등 이것은 이른바 빅데이터(BIG DATA)시대가 열리게 된 것을 말합니다. 과거와 같은 방법으로는 이제 데이터를 분석하고 관리 할수 없게 된 것이죠.





과거에는 대용량의 데이터를 처리하기가 너무나 힘들었습니다. 수집서버, 저장서버, 분석서버, DB서버, 분석된 데이터를 가시적으로 표현해주는 솔루션까지...1 Tier, 2 Tier, 3 Tier...너무나 많은 단계와 처리과정을 거쳐야 했고, 느리고 복잡하고 고정적 화면만 보여주는 등 비효율적이기 그지 없었지요. 하지만 현재는 HADOOP, MapReduce, AIE와 같은 알고리즘과 엔진이 출연하였고 쉽고 간단하게 대용량의 대이터를 처리 할 수 있게 되었습니다. Splunk는 단순히 수집(Indexing)서버와 분석(Header)서버만 있으면 그만입니다. 데이터가 많지 않다면 두개를 같이 두어 1 Tier로 만들 수도 있구요.




단순히 수집/분석 만이 아니구요, Query수준의 검색어(질의문)을 제공하고 유연한 형대로 대쉬보드를 생성/수정 할 수 있습니다. 사용자가 원하는대로 레포팅할 수 있는 것은 물론이구요. 이말은 많은 노력과 비용을 들이지 않아도 사용자가 원하는 맞춤 형태로 솔루션을 사용할수 있다는 이야기입니다.


Splunk에서 사용하는 수집데이터는 결국 Status Data(Log)를 기반으로 하구요. Time Stamp와 구분된 Field값을 갖고 있어야 하는 것이 최소 조건입니다. (=그래서 엄밀히 말하면 Semi-Structured Data) 지금도 디바이스장비나 서버에서는 장비의 상태, 프로세스의 상태를 알려주는 Log를 쉴새없이 쌓아놓고 있습니다. 과거에는 이러한 Log값들에서 무언가를 찾아낸다는 것은 정말로 어려운 일이었습니다. 하지만 빅데이터 처리기술을 이용해서 이것들을 활용하면 유용한 의미의 가치들을 뽑아 낼 수 있다는 이야기구요. 보안/관제에서의 실시간 대응은 물론이고, 우리가 생각해보고자 하는 마케팅 분야에 응용하면 Real-Time Biz 활동을 펼칠 수 있다는 이야기가 되죠.

test2


Real-Time이란 것은 감사분석, 서버관리, 보안/통제, 실시간 모니터링, BI, 장비생산성등 수십가지 분야에 응용이 가능하다는 얘기구요. 이제까지 보이지 않던 분야에서의 가치를 찾아낼 수 있다는 이야기가 됩니다. 우리가 이야기하려는 마케팅 분야에 적용해 보면...

20대 여성은 평일 비오는날 커피마시는 것을 선호하더라, 하지만 조각케익 매출은 맑은 날에 절반에도 못미친다는 분석 결과가 나온상태라면 (이러한 것도 Splunk로 분석이 가능합니다.)

[평일 비오는 날, 20대 여성이 커피를 카드로 결제하는 순간]

결제 순간 Real-Time으로 조각케익 30%할인 쿠폰을 SMS로 제공한다면 매출액 증대에 상당한 도움이 되겠지요!

기아자동차 소셜 마케팅 분석


남자들의 로망 중 하나가 멋있는 스포츠카를 끌고 미모의 여성과 함께 해변도로를 거침없이 달리게 아닐까요그런 생각을 하다 이번에는 자동차에 대해 SNS분석을 해보았습니다.
국내 자동차 업체 중 가장 활발히 SNS 활동 중인 기아자동차에 대해 키워드 분석노출도 정도를 알아내어 사람들이 무슨 이야기를 하는지 한번 살펴 보았습니다.
그리고 기아자동차는 글로벌 회사이다 보니 국내 SNS 컨텐츠 뿐만 아니라 해외에서 진행하는 프로모션에 대해 발생되는 컨텐츠도 같이 분석 하였습니다.
먼저 약 10일 동안 발생된 트윗에 대해 분석했는데요데이터 양이 엄청나더군요 20만건 이상의 데이터가 수집되었습니다먼저 기아자동차 관련하여 키워드를 추출 해보았습니다.


여러 키워드가 추출 되었네요.. 근데 Hamster라는 키워드가 눈에 띄는데요기아자동차의 쏘울CF Hamster가 출현했군요게다가 Wanna Buy라는 키워드도 보이네요단순히 키워드를 통해 보면 CF에 대한 효과가 상당히 좋았다는 것을 알 수 있네요.
먼저 무슨 CF인지 동영상을 한번 볼까요~?





햄스터의 셔플댄스가 무지 귀엽네요~ 그럼 정말 이 광고 효과로 인해 고객들의 소비심리를 이끌어 냈을까요? 한번 Wanna Buy라는 키워드로 직접 SNS글을 검색 해보겠습니다.




이런 기아CF는 나를 햄스터를 사고 싶게 한다. 하지만 차는 아니다라는 트윗이 굉장히 많이 올라왔네요. 트위터에서 영향력자인 @fun******, @ItsA****** 가 광고에 나오는 햄스터는 사고 싶지만 차는 사고 싶지 않다는 트윗을 올려 2일만에 약 500건 이상 RT되었고, 이를 통해 해외에서 디자인은 좋아졌지만 아직 기아자동차 성능에 대한 의구심을 갖는 평이 존재 한다는 것을 알 수 있었네요.


그럼 이번에는 기아자동차 모델 별로 노출도가 어떨까요? 노출도는 곧 사람들의 반응, 사람들의 관심정도와 같다고 보시면 되겠습니다.




이 데이터 수집 당시 프라이드가 곧 출시되는 시점 이여서 국내에서 프라이드에 대한 노출도가 상당히 높네요. 해외에서는 햄스터CF(?) 때문에 쏘울에 대한 노출도가 높아진 것으로 보이네요.
그렇다면, 한번 새로 출시되는 프라이드에 대한 사람들의 생각을 살펴볼까요






위의 분석 결과를 통해 4가지의 시사점을 찾을 수 있겠네요.

  • 부산국제영화제 폐막시 티켓 이벤트를 통해 큰 노출효과를 보았으며, New-프라이드에 대한 이미지가 “멋지다”, “이쁘다”, “젊다” 라고 생각함
  • 스타일리쉬한 외형과 국내 유명가수 카라와 함께하는 프로모션이 매우 잘 어울리는 것 같다고 평가함
  • New-프라이드에 대한 새로운 디자인에 대해 매우 긍정적으로 생각하고 있음
  • 하지만 디젤 프라이드가 출시되지 않은 점에 대한 다소 아쉬워 하는 고객들이 몇몇 존재

이번 포스팅에서는 기아자동차에 대해 사람들의 이야기를 분석해 보았는데, 상당히 흥미롭네요. 단순히 이야기가 많이 퍼져나가는 것이 중요한 것이 아니라 어떤 내용이 퍼져나가는지가 더욱 중요하다는 것을 다시 한번 알려주네요. 기업들은 SNS에 대해 귀를 기울이고 정말 고객이 무엇을 원하고, 무슨 이야기를 하는지 항상 촉을 세워야되겠습니다.

-Post by Namyoun 

2012년 3월 28일 수요일

3월의 이슈 : 빅뱅과 아이패드

3월 핫이슈 중 2가지를 고르라면 저는 아이패드 출시와 빅뱅 앨범 출시를 꼽고 싶습니다. 물론 여러 분야에 이슈들이 있었겠지만 재미있는 주제로 가는 것이 좋겠죠??
일단 아이패드와 빅뱅에 대해 SNS 동향을 살펴볼까요? 데이터 대상은 트위터, 블로그, 뉴스, 카페로 정했습니다.



위의 그래프를 보니 3월 간 빅뱅과 아이패드에 대한 동향을 쉽게 살펴 볼 수 있네요.
먼저 빅뱅에 대해 얘기해 보자면, 빅뱅 앨범이 29일에 출시되었는데 역시나 29일 노출도가 매우 높군요. 그리고 주기적으로 노출도가 상승하는 경우가 있는데 요일을 보니 정확히 일요일에 노출도가 급상승 하네요. 무슨 이유로 일요일에만 노출도가 급상승 할까요? KBS뮤직뱅크, SBS인기가요, MBC쇼 음악중심 모두 제각기 다른 요일에 방송하고 빅뱅은 여러 예능 프로에서 활동 중인데 유독 일요일에만 급상승 하는 이유가 궁금하네요.


 
3/4
3/11
3/18
1
컴백
오늘
2AM
2
런닝맨
컴백
무대
3
앨범
무대
샤이니
4
오늘
런닝맨
인피니티
5
인기
노래
오늘

이를 알아내기 위해서 각 일요일 마다 키워드 변화를 살펴 보았습니다. 알고 보니 34일은 빅뱅이 SBS 런닝맨으로 첫 방송활동을 시작하는 날이군요. 그리고 3 11일은 SBS인기가요를 통해 첫 컴백무대를 갖네요. 318일에는 경쟁가수들에 대한 키워드가 많이 보이는데 경쟁 가수들이 많이 컴백을 해서 팬들의 경쟁 심리로 이런 결과가 나왔네요.

그래도 먼가 석연치 않은 부분이 있네요. 당연히 방송출연 하면 이슈화가 되기 마련인데 유독 일요일에만 노출도가 급증한 것은 분명히 다른 이유가 있을 거라고 생각이 드네요. 그래서 빅뱅과 KBS에 대해 검색 해보니 다음과 같은 결과가 나오네요.



감성도도 부정적이고, 키워드를 보니 심상치 않은 키워드들이 보입니다. 역시나 조금 더 내용을 살펴보니 KBS랑 사이가 많이 안 좋군요. 과거에 이런저런 일이 있었나 봐요제가 광팬은 아니라 패스~ 그리고 MBC의 쇼음악중심에도 나오지 않는다고 하더군요결국 일요일에 방송하는 SBS인기가요만 출연하다 보니 자연스럽게 일요일에만 노출도가 상승되는 패턴을 보여주게 되었네요.

자 다음은 아이패드 동향을 살펴 볼까요? 아이패드는 아주 간단하게 38일 폭발적인 노출도를 보여주었네요. 역시 이날은 애플의 CEO 팀쿡이 뉴 아이패드를 공식 발표하는 날 이였습니다.
워낙 인기있는 제품이다 보니 사람들의 이런 저런 말이 많았는데요. 한 번 날짜 순대로 키워드를 정리해 보겠습니다.



빨간색으로 표시한 키워드를 보면 사람들이 무슨 이야기를 했는지 알 수 있습니다. 먼저 처음 공개되었을 때는 뉴아이패드라는 것을 몰랐기 때문에 그 다음 날부터 라는 단어를 사용하기 시작했고 기존 기능과 무엇이 다른지 많이 이슈 됐네요. 그리고 아이패드 출시를 앞두고 삼성전자가 아이패드로 인해 돈방석에 앉는다는 이야기, 법정 싸움 등으로 16일에 관심을 끌었고, 18일 미국 출시가 되고 다음날 국내에 출시의 향방을 묻는 다양한 이야기가 오갔습니다.

이처럼 시간대별, 요일대별로 키워드를 분석하고 패턴을 찾아내는 일이 사람들의 행동을 이해하고, 마케팅 또는 이슈관리 등 다양한 방법으로 이용 될 수 있다고 생각이 듭니다.


- Post by Namyoun 

빅데이터를 위한 개방형 DB 프레임워크, “하둡”의 이해


 선사시대 , 농경을 시작할 무렵 어느 부족이 농사를 짓기 위해 드넓은 평야에
다다랐을 이미 땅을 일궈 밀을 재배하고 있는 다른 부족이 있었다. 부족에게 평야의 일부를 빌려달라고 요청하자 너무 많은 대가를 요구했다. 그래서 평야를 놓고 싸우려는데, 다른 부족장이 대안을 제시했다. 평야를 지나가면 우리 능력으로도 일궈내지 못한 언덕이 있다. 언덕을 가져라.밀밭을 지나 언덕을 봤을 부족은 놀랐다. 번은 어마어마한 넓이에, 번은 땅이 너무 거칠어 제대로 일구기가 힘들다는 데에. 이것이 바로 빅데이터이며, 7 동안 땅을 일궈 밭을 만들어 것이 바로 하둡(Hadoop) 프로젝트다. 일궈낸 밭에 무엇을 심고, 어떻게 가꿀지는 IT업체와 기업들이 일이다. 여기서는 하둡이라는 밭에 대해, 그리고 무엇을 심을 알아보기로 하자.

어떻게 가꿀지는 데이터베이스 관련한 거의 모든 IT업체들이 설명하고 있으니 여기서는 논외로 하겠다.


빅데이터 시대의 대표 기술, 하둡


 2008 이래로 데이터 폭증 시대가 도래했다. 5년만에 데이터 량이 44배에 이를 것으로 예측했고, 실제 이를 능가하는 수치를 기록했다. 이는 단순한 데이터량의 증가가 아니라 데이터의 다양성, 속도 등을 함께 아우르는 의미다. 특히 모바일 기기나 소셜 미디어 등에서 생산되는 비정형 데이터의 증가는 소비자의 행태를 바꾸고 있으며, 이는 산업계에서는 비즈니스 경쟁의 규칙조차 바꾸고 있다. 이제 빅데이터는 피할 있는 것이 아니며, 누가 먼저 빅데이터를 활용하느냐가 향후 비즈니스를 판가름하는 척도가 것이다. 그러나 문제는 폭증하는 데이터를 저장, 분석, 활용하는 방법이 기존 방식으로는 거의 불가능 하다는 것. 특히 기존 방식이 1970~80년대 RDBMS(Relational DataBase Management System), 90년대 DW(Data Warehouse) 시대였다면, 이제 빅데이터기술이 필요하게 것이다. 빅데이터 저장 분석 기술을 대표하는 것이 바로 하둡이다.

검색에서 시작한 하둡, 클라우드 컴퓨팅과 만나 활기


 하둡(Hadoop) 지난 2005 루센 개발자인 더그커팅과 마이크 카파렐라가 구글의 맵리듀스 알고리즘을 구현하면서 만들어졌다. 이후 커팅은 야후로 옮겨가 검색 서비스에 하둡 기술을 적용하는 프로젝트에 참여했으며, 최종적으로는 4만여 대의 서버에걸쳐 하둡을 구현했다.
하둡이 널리 유명해지기 시작한 것은 클라우드 컴퓨팅과의 연계를 통해 상상을 초월하는 데이터 분석성능을 제공하는 등의 가시적인 효과가 나타났기 때문이다. 하둡 프로젝트의 핵심 설계자인 화이트가 저술한 <하둡 완벽 가이드> 따르면, 전에는 시간이 너무 오래 걸려 결과를 얻을 없었던 문제들을 이제는 하둡으로 빠르게 해답을 얻을 있게 됐다. 대표적인 사례는 다음과 같다.

□ 2008 2 - 뉴욕타임스는 1851년부터 1980 12월까지 130 분량의 신문기사 1,100 매를아마존 S3 저장하고, 하둡을 이용해 4테라바이트 크기의 데이터를 24시간 만에 변환했다. 이는, 일반 서버로 대략 14년이 걸리는 어마어마한 작업량이다.
□ 2008 4 - 하둡은 리듀스로 테라바이트 데이터 소트하기대회에서 2007년도 우승자의 297초에 비해 2/3 수준인 209 만에 정렬하며 우승했다. 이어 2009 5, 야후는 하둡으로 62 만에 1테라바이트를 정렬했다.
□ 2009 4 - 1 소트대회에서 500기가바이트를 59초에(1,400 노드에서) 정렬하며 우승했다. 또한 100 테라바이트를 173분에(3,400 노드에서) 정렬했다.

데이터 분산 저장 분산 처리 프레임워크, 하둡


 하둡은 대량의 자료를 처리할 있는 대규모 컴퓨터 클러스터에서 동작하는 분산 애플리케이션을 지원하는 오픈 자바 소프트웨어 프레임워크다. 원래 검색의 분산처리를 지원하기 위해 개발된 것으로, 아파치 루센의 하부 프로젝트였다. 분산처리 시스템인 파일 시스템을 대체할 있는 하둡 분산 파일 시스템, HDFS(Hadoop Distributed File System) 분산 처리 시스템인 리듀스(Map Reduce) 구현한 것이다. 이는 위키피디아에서 정의한 하둡의 의미를 조금 수정한 것이다. 마디로 얘기하면, 하둡은 대용량 데이터 처리 분석을 위한 대규모 분산 컴퓨팅 지원 프레임워크다. 하둡의 구성 요소 가운데 핵심 구성은 바로 저장과 처리(계산)이다. HDFS 통해 분산 저장하고, 리듀스를 통해 분산 처리한다는 . 여기서 하둡의 가장 특성이 나타난다. 바로 분산(Distributed)이다. 분산 처리, 분산 저장이다. 하둡은 여러 개의 컴퓨터를 마치 하나인 것처럼 묶어주는 기술을 통해 저장 공간과 계산 능력을 늘린다.




출처 : IDG Korea

화장품에 대한 소셜 이야기

여성분들 화장품 많이 쓰시죠? 이번 포스트는 20대 초,중반 여성들에게 인기가 많은 이니스프리의 SNS활동에 대해 분석해 보았습니다. 특히 이니스프리는 소녀시대 윤아가 CF에 출현하여 많은 관심을 받고 있습니다.



먼저 SNS에 올라오는 글들을 키워드 분석을 통해 사람들이 무슨 이야기를 하고 있고, 이니스프리가 운영 중인 트위터 계정 활동 글들을 통해 무슨 효과가 일어나는지 알아보았습니다.




위의 분석 결과를 보면 트위터 활동을 통해 크게 4가지 효과가 일어났네요.


   1. 브랜드 인지도 상승
   2. 고객의 대화 참여 유도   
   3. 제품 노출 효과     
   4. 고객과의 긍정적인 소통


이니스프리는 트위터 및 페이스북에서 고객들과 쌍방향 대화를 통해 고객들과 소통하고 있고, 다양한 이벤트를 시행하여 사람들의 관심 및 브랜드의 인지도를 상승 시키고 있네요.


그렇다면 이번에는 특정 제품에 대한 사람들의 이야기도 한번 조사해 볼까요?
클린앤클리어 라는 제품에 대해 많이들 알고 계실 겁니다. 다들 10대 후반에 여드름이 고민이였던 분들은 한번쯤은 사용해 보셨을 텐데요, 작년 11월달 데이터를 바탕으로 키워드 분석을 해보았습니다.






위의 키워드를 분석해본 결과 3가지 이야기를 도출해 낼 수 있었습니다.

  • 클린앤클리어는 10대들에게 여드름에 효과가 좋은 제품으로 인식되고 있음
  • 제품 뿐만 아니라 과거부터 광고모델에 대한 관심이 컸기 때문에 SNS에서도 광고모델에 대한 팬들의 이야기가 오감
  • 클린앤클리어가 오프라인에서 상당한 인지도가 있는 제품임에도 불구하고, SNS 상에서 노출도가 상당히 낮은 편임
역시 클린앤클리어는 여드름에 좋고, 그 시대에 대표되는 청순한 이미지의 모델을 CF모델로 발탁하는 건 항상 따라다니는 이미지 이네요. 하지만 파이팅 넘치는 SNS 마케팅이 없어 많은 이야기가 없는 것은 마케팅 담당자로서도 좀 아쉬운 일이 아닐까 생각이 듭니다.


                                                                                                                                             - Post by Namyoun