2012년 3월 26일 월요일

빅데이터 시대의 새로운 직업 : Data Scientist



데이터 과학자란?



빅데이터라는 커다란 흐름에 맞추어 최근 데이터 과학자라는 새로운 직업이 생겼다해외 각 벤더사와 언론사들이 빅데이터 시대가 도래함에 따라 빅데이터를 새로운 데이터 분석 기술과 모델링 기법을 사용하여 통찰력 있는 결론을 발견해내는 데이터 과학자라는 새로운 직업에 주목하고 있다.
기존의 비즈니스 인텔리전스(BI)와 데이터웨어하우징(DW)에서 한 단계 진화된 빅 데이터 시대의 정보 분석 기법을 포함한다고 할 수 있다기존의 경우 데이터 사이즈가 지금보다 상대적으로 작았음에도 불구하고 그 분석 결과의 정확성과 실용성은 높지 않은 편이었다기업들은 그들이 갖고 있는 데이터가 무엇인지 확실히 알지 못하기 때문에 모든 것을 끊임없이 보관해야 했다그러다 보니 기업들이 보유하고 있는 데이터의 정확성은 낮아졌고 수집된 데이터들의 경우 정제가 잘 안 돼 있거나 있어도 중복돼 있는 경우가 많았다.

하지만 빅 데이터 시대로 접어들면서 기업들이 보유하고 있는 데이터 가운데 특정한 목적과 관련된 핵심 데이터를 깊이 있게 분석할 경우훨씬 더 정확하고 실용성 높은 이론을 이끌어 낼 수 있게 됐다.

이처럼 빅 데이터 시대에 걸맞은 분석 기술의 필요에 의해 생겨난 고급 분석(Advanced Analytics) 분야에서 종사하는 사람이 `데이터 과학자(Data Scientist)'.







데이터 과학자의 필요 역량


데이터 과학이란 통계학컴퓨터과학머신러닝 등 기본적인 데이터 분석에 대한 이해뿐만 아니라 프로그래밍 실력과 특정 도메인에 대한 비즈니스 지식이 더불어 필요하다기존에 CRM전문가데이터 마이너통계학자 등 유사한 직군이 있지만 데이터 과학자는 포괄적으로 여러 방면에 전문적인 지식을 요구한다.




데이터 과학자라는 직업이 나오기 이전에는 크게 두 가지 관련 직군이 있었다하나는 분석가로서 분석툴을 통해 단순히 분석 결과만 내놓는 직군이다또 다른 하나는 새로운 기술을 개발하는 사람이다새로운 알로리즘을 개발연구하는 사람들을 말한다데이터 과학자는 이 두가지 역할을 모두 할 수 있어야 한다주어진 질문에 답하는 분석가가 아닌 그리고 기술만 연구하는 개발자가 아닌 직접 질문하고 스스로 답을 찾아낼 수 있는 그런 사람이 데이터 과학자 이다.







데이터 과학자가 되려면?



데이터 과학자가 되기 위한 전문지식과 기술에 대해서는 앞서 많이 이야기 하였다하지만 그것만으로 충분하지 않다고 생각한다단순히 위에서 말한 기술을 다 갖추었다고 하면 그냥 괴물 개발자라는 칭호가 더 어울리지 않을까 싶다.
데이터 과학자가 되고 싶거나 준비하는 사람들이라면, LinkedIn Monica Rogati씨의 말에 주목해볼 필요가 있다그녀는 LinkedIn Senior 데이터 과학자로서 LinkedIn의 유명한 친구추천기능 “You May Know” 모델을 머신런닝 기법을 활용하여 개발한 장본인이다.

아래의 동영상은 Monica Rogati씨가 빅데이터 속에서 어떻게 적절한 질문을 던지고 올바른 결과를 얻는지, 그리고 가치는 정보를 찾아내는지 사례를 들어 발표한 자료이다. 






그녀는 데이터 과학자가 되려면 비즈니스의 니즈가 무엇이고 무엇이 변하고 있는지 항상 귀를 기울이라고 한다비즈니스와 동떨어지지 말아야 서로 공감할 수 있기 때문이다또한 커뮤니케이션 능력 역시 중요하다고 강조한다당신의 분석을 통해 무엇을 찾았고 비즈니스에 어떻게 적용시킬 수 있는지 사람들이 쉽게 이해할 수 있어야 한다.

그렇기 때문에 인포그래픽 또는 비기술자가 쉽게 받아들일 수 있게 데이터를 만드는 툴에 대한 사용법이나 지식에 대해 준비하는 것이 좋다.

빅데이터에서 발견한 유용한 인사이트를 활용 할 수 있도록 데이터와 비즈니스 간에 다리를 놓아주는 역할이 데이터 과학자의 역할이다.



참고 포스트 보기


- Post by Namyoun 

댓글 없음:

댓글 쓰기