엑기스 | 새로운 시도, Auto ML

인공지능(Artificial intelligence, AI)의 역할

오늘날 인공지능(Artificial intelligence, AI)이라는 용어가 학술적, 기술적 측면을 넘어서 이제 다양한 산업과 비즈니스, 실생활에 영역까지 그 범위가 확대되었고, 많은 사람들이 AI 기술에 빠져 열광하고 있다. 즉 4차 산업혁명 시대의 핵심기술이 AI라는 사실은 누구도 부정하지 않을 것이다. L사의 인공지능 플랫폼은 어떻게 우리 일상생활에서 인공지능을 통한 편리함을 제공받을 수 있는지 보여주고 있다. 예를 들면 “하이 공기청정기 켜줘”라고 말하면 IoT 홈네트워크로 연결된 공기청정기가 작동하기 시작한다.

<그림1 L사 인공지능 플랫폼의 예>

출처 LG전자 공식 블로그

AI(Artificial intelligence)의 개념부터 다시 정의해 보자. 누군가는 “인공지능이란 이거야!“라고 쉽게 정의할 수도 있다. 실제로 어떤 사람들은 공장에 MRP(자재소요계획), ERP(전사적 자원관리) 등과 같은 IT 프로그램이나 솔루션을 전사적 차원으로 일괄적으로 적용했던 것처럼 인공지능 기술도 가능하지 않겠냐고 반문하시는 분도 있다. 또한 데이터 분석이라는 개념과 경험이 없는 상태에서 인공지능이 단순한 컴퓨터 프로그램 개발 영역인 것처럼 인식하는 경우도 많다.

ERP(전사적 자원관리)와 같이 업무나 공정 프로세스를 처리하는 소프트웨어는 과거의 데이터가 없어도 현재부터 처리되는 결과를 저장해도 업무를 처리하는 데 문제가 없다. 하지만 인공지능 기술과 같은 데이터 분석은 과거의 데이터가 없으면 시작 자체가 불가능하다.

인공지능 기술이 로봇을 만드는 것이라고 생각하는 사람도 있다. 로봇의 핵심이 인간과 같이 생각하는 지능이라는 점에서 일부 맞지만, 인공지능 기술이 로봇 기술은 아니다. 최근에는 가상 비서 개념으로 일정을 알려주거나, 내게 필요한 날씨, 뉴스, 쇼핑, 영화, 뮤직 등의 정보를 제공해주는 기능까지 인공지능 기술은 일상생활 속으로 더 정밀한 서비스로 진화하고 있다. 그래서 인공지능 기술이 활용 목적에 따라 전문가가 아닌 사람들이 보기에는 그 정의가 혼란스러울 것이다.

실제 인공지능 기술이 현장에 적용되는 과정을 살펴보면, 사람들이 하던 일들이 인공지능 기술로 대체되고 있다. 센스나 장비, 기기 등의 현 상태를 모니터링하는 단순한 영역부터, 복잡하고 불확실한 미래상황을 추론하는 영역까지 인공지능 기술이 적용되고 있다. 데이터 과학자의 관점에서 기계학습(machine learning)이나 딥러닝(deep learning) 모두 인간의 지능을 대체한다는 점에서 인공지능(Artificial intelligence, AI)이라고 정의할 수 있으며, 궁극적으로 인공지능이란 데이터를 기반으로 학습된 분석모델을 통하여 위험을 줄이고 효율성을 증대하고 비용을 감소하는 목표를 사람 대신 기계의 판단에 맡기는 것이다.

“인공지능이 왜 필요한 것인가?”라는 질문의 답은 어찌보면 명백하다. 사람 대신 기계가 일을 대신하는 것이다. 예를 들면 은행에서 자금세탁과 같은 범죄를 찾기 위해 얼마나 많은 사람들이 일일이 거래내역을 살펴보아야 하겠는가? 사람들이 수작업으로 많은 시간과 비용을 들여 불법 자금 내역을 찾는 것이 정말 효율적인 작업인가? 은행에서 어떻게 인공지능이 활용되는 지를 살펴보면, 왜 인공지능이 필요한 지 쉽게 이해할 수 있을 것이다. 매년 은행에서는 잠재적인 자금세탁방지(Anti-money laundering, AML)를 위해 탐지, 조사 및 모니터링 등에 수백만 달러의 예산을 투입하고 있다. 금융 규제 당국에서는 부적절하거나 의심스러운 수많은 자금세탁 경우의 수를 수시로 수작업으로 조사할 수는 없다. 결과적으로, 은행에서 잘 설계된 시스템을 통해 이를 걸러서 조사해야 하며, 조사를 통해 자금세탁이 의심되는 사람과 증거를 찾아 금융 규제당국에 보고하면, 금융 규제당국은 의심스러운 사람을 조사하고 자금세탁에 따른 징벌적 세금을 부과할 것이다. 실제 글로벌은행 C사의 경우, 이와 같은 시스템을 구축하여 잠재적인 자금세탁 혐의자를 찾고, 이상 거래를 모니터링하고 있다.

<그림2 C사 자금세탁방지 고객 세분화 모델링 예>

자금세탁 뿐만 아니라 금융사기로 인한 손실이 매년 증가하여 2017년 기준, 전 세계적으로 금융사기로 인한 손실이 200억 달러에 이른다고 한다. 그럼에도 불구하고 많은 은행들이 다양하고 새로운 형태의 불법을 저지르는 지능화된 조직이나 기업을 고비용의 구식 규칙 기반 금융사기 시스템과 금융사기 방지 솔루션 공급 업체에서 제공하는 블랙박스 모델로 아직까지도 감사(Audit)하고 있다.

매번 새로운 규칙을 적용하고 변화에 빠르게 대응하기 위해서는 몸값이 높고 능력이 많은 데이터 분석가와 과학자가 필요하다. 모델 갱신의 시간과 물리적인 한계가 있어 학습을 통한 새로운 규칙을 찾고 적용할 수 있는 새로운 접근이 반드시 필요하다. 분석 전문가의 수작업이 아니더라도 효과적이고, 비용측면에서도 효율적인 방법을 찾아야 하는 시점이다.

Auto machine learning(ML)이라는 새로운 시도와 필요성

새로운 금융사기 패턴과 복잡한 거래 내역 속에서 사람보다 정확하게 불확실한 정보만으로 빠른 추론을 가능한 시스템이 있을까? 새로운 패턴의 정보에 대해 실시간으로 학습하고 모델을 자동으로 갱신할 수 있는 방법은 없을까?

최근 Auto Machine Learning(ML)이라는 새로운 개념이 이슈가 되고 있다. 개념을 살펴보면, 데이터 과학자, 머신러닝 전문가가 아닌 분석 전문 지식이 없는 일반 사용자일 지라도 쉽게 머신러닝 분석을 자동으로 생성하고 활용 가능하게 하는 방법이다. 수집·정제된 데이터만 있다면 자동으로 분석 모델을 학습하고 갱신하여 최적의 분석 알고리즘을 추천받아 업무에 적용할 수 있다. Auto ML 서비스는 버튼 클릭만으로 기계 학습 서비스를 제공받으며, 일반사람들이 전문적으로 알고리즘 구현, 데이터 파이프 라인, 코딩 등을 모르더라도 최적의 분석 모델을 생성할 수 있다. 그래서 처음 이런 서비스나 솔루션을 접한 일부 사람들은 ‘만세!’라며 환호하고 이제 분석을 몰라도 되겠다고 말할 수도 있다.

그러나 결론만 먼저 말하면 일부는 맞고 일부는 틀리다. 다만 ‘오호’라는 표현이 가장 적절하다고 생각한다. 왜냐하면 Auto ML 서비스가 없는 이전 보다 확실히 시간적, 비용적 측면에서 효과적이고 효율적이기 때문이다. 사람들이 다 검토해야만 했던 모델 최적화를 기계가 대신해준다는 측면에서만 봐도 정말 ‘오호’라는 말로 표현하는 것이 맞다.

대표적인 Auto ML인 데이터로봇의 기능을 살펴보면 다음과 같다.

❑ 데이터 사전 처리 → 30여개 기법 중 최적 모델 선택 → 모델 하이퍼 매개 변수 최적화 후 처리 분석 모델 배포

❑ 로지스틱, 랜덤포레스트, 서포트벡터머신, Lasso, 베이지안, 신경망 모델 등 30여개의 분석 모델 중 최적 모델 선정

❑ 사람이 아닌 기계를 통한 최적화로 모델 구현 공수 70% 감소 효과

<그림3 대표적인 Auto ML 소프트웨어 'DataRobot'>

기계학습(machine learning) 이나 딥러닝(deep learning) 프로그램 등의 인공지능을 개발하기 위해서는 절대적으로 인공지능 전문가, 데이터 사이언티스트 확보가 필요하다. 그리고 그 중 가장 어려운 부분인 모델을 배포하고, 자동으로 학습하고 갱신하는 자동화 프로세스를 Auto ML 서비스나 솔루션이 있다면 쉽게 분석모델을 시스템에 적용시킬 수 있다. 굉장히 고무적인 일이기에 분명하다. 왜냐하면 분석가나 데이터 과학자의 경우, 분석 모델을 시스템 적용하는 개발 영역을 분석가가 본인이 직접해본 경험이 거의 전무하고, 분석가의 IT지식으로는 개발자의 역할을 대신할 수 없기 때문이다.

앞으로는 전체 분석 프로세스의 범위에서 보다 중요하고 집중적인 부분에서 전문 분석가와 데이터 사이언티스트의 역할이 강조될 것이다. 버튼 클릭을 하더라도 원리와 개념을 이해하지 못하는 사람이 한다면, 잘못된 부분을 나중에 판단할 수 있겠는가? 누구도 보장할 수 없다. 그래서 Auto ML 서비스가 있다고 해서 인공지능 전문가, 데이터 사이언티스트가 필요 없다고 단정 지어서는 안 된다. 여기서 접근을 잘해야 하는데, Auto ML 솔루션이나 서비스가 부족한 인공지능 전문가의 수요를 어느 정도 충족시키면서, 잠재적인 머신러닝 개발자의 수를 늘리는 효과를 낼 수 있다는 가능성에 무게를 더 실어주는 것이 맞다고 생각한다. 왜냐하면 전문가는 비록 아니지만, 서비스나 솔루션을 활용하면서 분석의 이해와 원리를 학습함으로써 데이터만 마련한다면 실제 업무에 분석모델을 적용할 수 있기 때문이다.

현재 구글과 아마존, 마이크로소프트에서 클라우드에 Auto machine learning(ML) 서비스를 확대하고 위해 지속적인 아키텍처 연구과 테스트가 진행 중이며, 앞으로 많은 기업과 사람들이 인공지능 활용에 적합하지 않다고 여겼던 분야에서 Auto machine learning(ML)을 통해 새로운 비즈니스와 가치 창출을 위해 시도하게 될 것이라고 예상된다. 앞으로 더 인공지능은 빠른 속도로 일상 속 깊숙이 자리 잡게 될 것이다. 머신러닝 모델과 알고리즘을 통해 새로운 비즈니스 가치를 창출하고, 우리 삶이 더욱 편해지는 날이 멀지 않은 것 같다.

기고 | 빅데이터사업본부 조치선

편집 | 사업기획팀 박예영

저작자표시 (새창열림)

'엑셈 경쟁력 > 엑.기.스' 카테고리의 다른 글

엑기스 \| 클라우드 환경에서의 통합 관제 (0)	2019.02.12
엑기스 \| OpenJDK 동향 (0)	2019.01.04
엑기스\| 개발자가 바라본 대시보드 (0)	2018.11.05
엑기스 \| 쉽게 이해하는 시계열데이터 비정상탐지 (0)	2018.09.05
플라밍고 \| 빅데이터 성능관리 솔루션, 플라밍고 (0)	2018.08.09