Splunk는 비정형 데이터를 분석하는 솔루션이구요, 보안/관제/모니터링 쪽에서는 그 기능성과 유연성 때문에 이미 핫이슈로 떠오른 솔루션입니다, Splunk는 비단 보안분야 뿐아니라 다양하게 응용이 가능한데요, 우리는 마케팅쪽으로 해당 솔루션을 접목해 응용해 보려 합니다. 먼저 Splunk소개부터 하겠습니다.
과거 GB(기가바이트) 단위로 처리하던 데이터가 현재에 이르러서는 PB(페가바이트) 단위로 처리해야하는 상황이 되었습니다. 마이크로 소프트 회장 빌게이츠가 개인용 데스크탑의 경우 640KB RAM이면 충분하다고 이야기 한 것이 불과 십수년 전이었던 것을 생각해보면, IT분야의 기술이란 것이 엄청나게 빠른속도로 발전하였고 그에 따른 데이터량도 어마어마 해졌다는 의미일 것입니다. 현대의 데이터량은 그야말로 기하급수적으로 늘었다고 볼수 있구요, 텍스트, 논문, 업무문서, 멀트미디어등 이것은 이른바 빅데이터(BIG DATA)시대가 열리게 된 것을 말합니다. 과거와 같은 방법으로는 이제 데이터를 분석하고 관리 할수 없게 된 것이죠.
과거에는 대용량의 데이터를 처리하기가 너무나 힘들었습니다. 수집서버, 저장서버, 분석서버, DB서버, 분석된 데이터를 가시적으로 표현해주는 솔루션까지...1 Tier, 2 Tier, 3 Tier...너무나 많은 단계와 처리과정을 거쳐야 했고, 느리고 복잡하고 고정적 화면만 보여주는 등 비효율적이기 그지 없었지요. 하지만 현재는 HADOOP, MapReduce, AIE와 같은 알고리즘과 엔진이 출연하였고 쉽고 간단하게 대용량의 대이터를 처리 할 수 있게 되었습니다. Splunk는 단순히 수집(Indexing)서버와 분석(Header)서버만 있으면 그만입니다. 데이터가 많지 않다면 두개를 같이 두어 1 Tier로 만들 수도 있구요.
단순히 수집/분석 만이 아니구요, Query수준의 검색어(질의문)을 제공하고 유연한 형대로 대쉬보드를 생성/수정 할 수 있습니다. 사용자가 원하는대로 레포팅할 수 있는 것은 물론이구요. 이말은 많은 노력과 비용을 들이지 않아도 사용자가 원하는 맞춤 형태로 솔루션을 사용할수 있다는 이야기입니다.
Splunk에서 사용하는 수집데이터는 결국 Status Data(Log)를 기반으로 하구요. Time Stamp와 구분된 Field값을 갖고 있어야 하는 것이 최소 조건입니다. (=그래서 엄밀히 말하면 Semi-Structured Data) 지금도 디바이스장비나 서버에서는 장비의 상태, 프로세스의 상태를 알려주는 Log를 쉴새없이 쌓아놓고 있습니다. 과거에는 이러한 Log값들에서 무언가를 찾아낸다는 것은 정말로 어려운 일이었습니다. 하지만 빅데이터 처리기술을 이용해서 이것들을 활용하면 유용한 의미의 가치들을 뽑아 낼 수 있다는 이야기구요. 보안/관제에서의 실시간 대응은 물론이고, 우리가 생각해보고자 하는 마케팅 분야에 응용하면 Real-Time Biz 활동을 펼칠 수 있다는 이야기가 되죠.
Real-Time이란 것은 감사분석, 서버관리, 보안/통제, 실시간 모니터링, BI, 장비생산성등 수십가지 분야에 응용이 가능하다는 얘기구요. 이제까지 보이지 않던 분야에서의 가치를 찾아낼 수 있다는 이야기가 됩니다. 우리가 이야기하려는 마케팅 분야에 적용해 보면...
20대 여성은 평일 비오는날 커피마시는 것을 선호하더라, 하지만 조각케익 매출은 맑은 날에 절반에도 못미친다는 분석 결과가 나온상태라면 (이러한 것도 Splunk로 분석이 가능합니다.)
[평일 비오는 날, 20대 여성이 커피를 카드로 결제하는 순간]
결제 순간 Real-Time으로 조각케익 30%할인 쿠폰을 SMS로 제공한다면 매출액 증대에 상당한 도움이 되겠지요!






