본문 바로가기
엑셈 기업문화/엑셈 사람들

엑셈사람들| 빅데이터의 은둔자, 빅데이터본부 전략기획팀 윤효근 박사를 만나다.

by EXEM 2016. 10. 26.

 

 

 

 

 

10월의 어느 멋진 가을 날, 양재 빅데이터 센터에 다녀왔습니다. 한창 개발이 진행되고 있는 ‘플라밍고 v3.0’도 만나고, 신규 론칭한 빅데이터 교육세미나의 강사 윤효근 팀장님도 만나 보았습니다. 엑셈의 새 얼굴을 소개합니다.

 

 

 

Q: 간단히 자기소개 부탁 드립니다.
보통 소개할 때 빅데이터 은둔자라고 이야기 합니다. 빅데이터는 2010년에 처음 시작해서 그때부터 밖으로 드러나기보다 밑단에서 그림 그리는 일을 해왔습니다. 재미있는걸 하고 싶어요. 그래서 제가 좋아하는 분야인 빅데이터와 클라우드를 즐겁게 연구하고, 개발하고 싶은 사람입니다. 나서는 것을 별로 안 좋아하다 보니, 앞으로도 빅데이터 은둔자로 살겠다는 의지는 변함없습니다.

 

 

 

Q: 빅데이터의 그림을 그린다는 건
빅데이터의 그림을 그린다는 건, 제가 생각하는 미래를 만들어 가는 것입니다. 밑단에서 필요한 것들을 툭툭 던져주면서 이 정도 기간이면 이런 서비스가 만들어 지고, 이러한 방향으로 활성화 될 것이라는 분석과 예측을 합니다. 지금도 우리나라에 돌고 있는 빅데이터나 클라우드 그림들은 제가 예전에 그려놓은 것들이 대부분입니다. 또 하나는 교육 입니다. 감각이 있는 사람을 발굴해서 기본기부터 가르치는 것입니다. 대표적으로 제가 처음 클라우드 쪽에 입문시키고, 오픈스택에 대해 교육을 했던 사람이 한국오픈스택협회(클라우드 기술 연구 커뮤니티) 회장이 되었습니다. 하지만 스스로 나서기 보다 누군가를 통해 제 과업을 인정받고 활용되는 게 보람도 되고 좋습니다. 은둔자라고 하는 이유를 아시겠죠. (웃음)

 

 

 

Q: 최근 이슈가 되는 인공지능 분야에 대해 강의 요청이 많을 것 같습니다. 인공지능이란, 그리고 우리가 잘못 알고 있는 통념이 있다면.
지식이 얕으면서도 알고 있는 일부분을 과장해서 잘못된 방향으로 가이드 하는 사람들이 있습니다. 인공지능에 대한 이들의 접근은 코끼리 뒷다리 만지기 식으로, 각자 만진 부분만 가지고 이야기 합니다. 인공지능이라는 것은 말 그대로 selforganization(자기 조직화)이 되는 구조를 가리킵니다. 그런데 요새는 핵심은 빠지고 인공지능에서 기계학습을 위한 신경망 중 일부가 인공지능인 것처럼 포장되고 있습니다. 이렇게 개념이 잡히면 바로 잡기가 굉장히 어려워 집니다.
클라우드도 마찬가지 입니다. 제가 인공지능 연구를 하다 보니 굉장히 오래 전부터 자연스럽게 클라우드를 접하고 공부해 왔습니다. 클라우드에 대한 개념은 우리나라가 외국과 굉장히 다르게 인식되고 있습니다. 우리나라는 단순히 인프라적인 클라우드를 생각합니다. 반면, 외국에서는 인프라에 대한 것은 아마존과 같은 인프라 사업자들에게 맡기고, 클라우드라고 하면 사용자의 환경에서 서비스 할 수 있는 구조를 이야기 합니다. 이는 스마트 환경과 유사합니다. 한 때 이슈가 되었던 유비쿼터스 보다 한 단계 위의 서비스라고 할 수도 있습니다. 스마트폰이 없이도 언제 어디서나 우리가 필요로 했던 맞춤 서비스를 제공받을 수 있는 것이 클라우드 서비스 입니다. 우리나라에서는 인프라 서비스를 할 것인지, 실제 클라우드 서비스를 할 것인지의 구분 없이 하나로 논하고 있습니다. 염려스러운 부분은, 실제 클라우드 서비스는 사라지고 인프라 서비스가 클라우드 서비스로 대체되는 것입니다. 저도 공부하면서 왜 이렇게 실제 개념이 와전된 것 일까 했는데, 결국 인프라 적인 것만 듣고 배웠던 사람들이 앞장서 이게 클라우드입니다 라고 정의해 버리니 인프라=클라우드 라고 이해해 온 것이 아닐까 싶습니다. ‘웹 하드’는 아시는 바와 같이 데이터를 웹으로 저장하는 방식입니다. 하지만 실제 웹하드와 클라우드 저장소를 구분하는 사람은 아무도 없습니다. 사용자 입장에서는 똑같거든요. 그럼 웹하드를 클라우드 서비스라고 정의할 수 있을까요? 그건 아닙니다. 클라우드 저장소는 내가 가지고 있는 정보를 디바이스의 종류에 구애 받지 않고 빠르게 저장소에 올려 놓고 언제 어디서나 정보의 활용이 가능합니다. 만약 집에 스마트폰을 두고 왔더라도 스마트폰에 저장된 정보를 보는데 전혀 문제가 없죠. 이게 클라우드 입니다. 이런 개념들이 어려우니 웹하드가 클라우드 저장소처럼 알려지고, 빅데이터도 마치 하둡이 빅데이터 시스템인 것처럼 이야기 합니다. 하둡은 그저 빅데이터 분석을 위해 이용하는 도구일 뿐입니다. 하둡을 굳이 사용하지 않아도 될 데에서는 하둡이 필요하다고 하고, 실제 하둡이 필요한 곳에서는 하둡이 아닌 다른 저장소를 사용하게 되는 것입니다. 빅데이터 분석에는 체계적인 절차가 있는데 그런 것들을 무시하고 서비스를 하는 경우를 보면 안타까울 때가 있습니다.

 

 

 

Q: 인공지능 분야를 선택한 이유.
석사 과정 때 뭣도 모르고 소개 받는 데가 인공지능 연구실 이었습니다. 그러면서 인공지능이 뭐다라는 걸 이해했고, 재미있다 보니 박사까지 하게 되었습니다. 당시 제가 논문으로 썼던 게 최근에 현실화 됐습니다. 기본 골조는 영화 추천 서비스인데요. 사용자의 성향을 판단할 수 있는 데이터를 바탕으로 사용자 환경에 맞는 영화를 추천하는 시스템 입니다. 예를 들어, 주로 몇 시에, 어떤 영화를, 누구와 함께 보고, 어떤 영화에 평점을 얼마를 줬는지에 대한 사용자 활동 데이터를 분석하게 되는 거죠. 만약 연인이랑 영화를 본다고 하면 연인과 자주 봤던 ‘로맨틱 코미디’를 현재 개봉작 중에 추천하고, 이어 개봉 예정작 중에 또 한편을 추천합니다. 제가 했던 게 바로 추천 서비스를 자동화하고, 사용자 학습을 통해 사용자가 영화뿐만 아니라, 퇴근하고 집에 왔을 때 필요한 것들을 지속적으로 서비스 하는 것입니다. 클라우드와 빅데이터를 공부한 이유도 바로 이 것 때문입니다. 아직까지는 인공지능이라고 하면 분석을 위한 인공지능이지, 서비스를 위한 인공지능은 아닌 것 같습니다. 로봇이라고 하는 것도 어떤 특정 분야에 반응하게 만든 프로그램일 뿐, 자기학습을 통해 스스로 생각하고 그 다음 동작을 만들어내는 건 아직은 좀 어렵습니다. 25년 후라면 가능할 수도 있겠네요.

 

 

 

Q: 인공지능은 어디까지 발전할 수 있을까요.
인공지능을 공부하면서 자연스럽게 관심을 가져온 분야가 뇌 과학과 자연과학 입니다. 인공지능은 자연을 기반으로 나온다고 생각합니다. 말 그대로 자연이라고 하는 것은 상처가 나면 스스로 복구해서 새로운 환경을 만드는 자가치유가 가능합니다. 인공지능도 동일합니다. 고장이나 오류가 났을 때 스스로 학습해서 새로운 환경을 구축해 나가는 거죠. 하지만 머지 않은 미래에 인간이 하는 거의 모든 일을 대체한다고 하면 우려되는 점은 많습니다. 그때는 일을 통해 본연의 즐거움을 찾는 사람들이 사라질 수도 있습니다. 후손들이 할 일이 없어지겠죠. 일을 안 해도 되니, 교육의 필요성도 사라지고. 그럼에도 불구하고 제가 하고 싶은 이유는 인공지능의 안 좋은 예를 비껴가면서 사람들에게 이롭게 할 수 있는 것들이 있다고 믿기 때문입니다.

 

 

 

Q: 분석가의 역할이 그만큼 중요해졌습니다. 21세기 가장 유망한 직업으로 데이터 사이언티스트가 각광받고 있습니다. 우리나라에서 데이터 분석가 또는 사이언티스트라고 하면 어떤 역할을 하게 되고 전망은 어떻게 보시나요.
데이터 분석가는 Data Scientist와 Data Analyst로 구분합니다. 우리나라에 들어와서 직군을 분류할 때 가장 혼동이 있었던 부분이라고 생각합니다. Data Scientist는 데이터 분석뿐만 아니라, 데이터를 생산하고, 모을 수 있는 장소를 만들고, 쌓인 데이터를 끄집어 내 사용자에게 활용 가능한 서비스를 연구하는 직종이라고 한다면, Data Analyst는 도출된 데이터를 가지고 사용자 구미에 맞는 분석을 합니다. 사견으로, 데이터 분석에 대해 Data Scientist와 Data Analyst가 바라보는 시각이 각각 다를 거라고 봅니다. Data Analyst의 분석을 예로 들자면, 설문조사의 오차와 신뢰도 표기가 있습니다. 데이터 분석에서 오차는 있을 수 있지만, 신뢰도 측정에서 100%의 데이터는 지금까지 없었습니다. 만약 신뢰도 95%라고 한다면, 결국 5%의 데이터 조작을 인정한 것이나 다름없죠. 반면, Data Scientist의 데이터 분석은 가공되지 않은 있는 그대로의 결과물입니다. 하지만 고객은 가공 없는 데이터를 신뢰하기 보다, 고객의 구미에 맞춘 통계데이터를 신뢰합니다. 질문에서와 같이 Data Scientist의 전망은 아주 유망하다고 볼 수 있습니다. 단편적인 예로, 스마트폰을 가지고 수집할 수 있는 데이터만 해도 어마 어마 합니다. 들고 다닐 때의 흔들림 정도, 사용하지 않는 시간, 위치 정보 등 모든 정보를 종합하면 사용자의 라이프사이클이 나오고, 그 주변사람들의 라이프사이클까지 분석이 가능합니다. 데이터를 잘 엮어서 사용자에게 맞는 컨텐츠 서비스를 제공하는 게 Data Scientist의 역할이고, 그 역할은 모든 분야에서 점점 더 확대될 것입니다.

 

 

 

Q: 엑셈과의 인연
2014년도부터 현 엑셈의 빅데이터본부 그룹장이신 우형제 이사님과 인연이 있었습니다. 돈과 관계 없이 좋아하는 일을 좇아 살았고, IT 떠돌이 생활도 많이 했습니다. (웃음) 마음잡고 행정자치부 빅데이터 분석과 공무원으로 착실히 살던 차에, 우이사님께서 끊임없는 찾아와 절 설득하셨습니다. 정말 하고 싶은 일을 할 수 있는 기회를 주시겠다며. 올 초부터 러브콜을 주셨고, 오랜 시간 신중한 고민 끝에 엑셈에 합류하기로 결정했습니다.

 

 

 

Q: 엑셈에서 맡은 역할
제가 엑셈에 온 이유는 말씀 드린 바와 같이 그림을 그리기 위해서 입니다. 엑셈에서의 데이터 분석 환경은 저장소를 구축해서 데이터를 넣고, 데이터를 끄집어 내서, 사용자가 원하는 빠른 검색엔진을 가지고 분석 데이터를 제공하는 것입니다. 엑셈에서 진행하는 빅데이터 사업의 예를 들면, 현재까지 사용자의 지문 데이터를 수초 내에 인식 가능한 기법은 없습니다. 1억 건에 대한 지문 검색 속도가 보통 30-40초입니다. 1-2초만에 검색이 가능한 일반 데이터에 비하면엄청 느린 거죠. 이런 지문 데이터를 인식해서 1초 내에 결과가 나온다고 하면 실시간 서비스를 성공시킬 수 있습니다. 또한, 차 곳곳에 센서를 달아서 차를 관리하는 인프라를 통해 데이터를 주고받는데 1초 간격이라고 하면, 사고 시 골든타임이라고 하는 5초 전 사고예방, 5분 내 인명구조가 가능하게 되는 것입니다. 그런 그림을 그리고자 합니다. 우리 나라에 있는 데이터만 다 오픈 해도 상당히 좋은 환경을 만들 수 있고, IT 국가 1위의 그림은 충분히 나올 것입니다. 그리고 기회가 된다면, 자동차 데이터를 실시간으로 모으고 자동차 운행 습관을 분석해서 한국 환경에 맞는 자율 주행 자동차 만들고 싶습니다. 이 바닥을 놓을 수 없는 큰 이유는, 데이터를 들여다 보고 뭔가를 만들어내고 상황을 제어할 수 있다는 것입니다.

 

 

 

Q: 빅데이터 본부에서 새롭게 론칭한 고객 세미나 “빅데이터 분석 기초”는 어떤 분들을 대상으로 하고 교육 목적은 무엇인가요.
큰 흐름은 빅데이터의 개념과 방향을 소개하는 것입니다. ‘빅데이터가 어떻게 해왔고, 앞으로 어떻게 갈 것이다. 그래서 이런 게 필요하다. 그리고 분석을 위해 플라밍고라는 도구를 활용할 수 있고, 이런 기관들이 사용하고 있다.’ 데이터는 있는데 어떻게 활용해야 할지 모르겠다 라고 한다면 잠깐이나마 그림을 그려볼 수 있도록 도와주는 강의를 진행하고 싶습니다. 전문 기술자보다는 빅데이터를 기획하거나 활용하는 분석가들이 교육을 들으면 좋을 것 같습니다.

 

 

 

Q: 업무 목표
공무원으로 일했던 방식으로 버리고, 다시 기업에 적응하는 것입니다. 지금은 본부의 모든 업무를케어하는 위치에 있다 보니 실시간으로 처리해야 할 일이 너무나 많습니다. 빠르게 일 처리가 가능하도록 다소 느슨해졌던 제 행동 패턴을 다시 돌려놔야 할 것 같습니다. 그 이후에 제 머리 속에 있는 것들을 꺼내서 현실화 시켜야죠.

 

 

 

Q: 꿈
사는 동안 제가 하고 싶은 일을 하는 것입니다.

 

 

 

 

 

 

빅데이터와 클라우드의 정확한 개념 전달은 물론, 초보자도 이해하기 쉽게 풍부한 사례를 접목시킨 설명을 들으면서, 엑셈이 신규 론칭하는 빅데이터 세미나에 너무도 적합한 교육자가 아닐까 생각했습니다. 바로 오늘이네요. 윤효근 박사님이 진행하는 '빅데이터 분석 기초' 세미나에 많은 관심 부탁드립니다. 이어 빅데이터 그림을 그리고 싶은 모든 분들에게 이 세미나를 강력히 추천합니다.   

 

 

 

 

 

 

 

 

 


 

 

 

 

 

 

 

 

댓글