태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

엑기스 | 신제품 발표 다시보기

기술이야기/엑.기.스 2019.07.10 13:46

 

 

 

지난 7월 17일~19일 코엑스에서 제 2회 국제인공지능대전이 개최되었습니다.

그 부대 행사로 다양한 세미나와 컨퍼런스가 진행되었는데요.

엑셈도 참여하여 엑셈의 기술을 널리 알리고 왔습니다.

 

 

 

공공부문 발주자 초청세미나

 

 

전시회 첫 날인 17일, 맞은편 308호에서는 InterMax Cloud를 소개하는 세션에 참가하였습니다.
쪼오기 3번째, 강인규 이사님 보이시죠?
 

 

이번 세미나에서는 단순히 제품 소개만 하는 것이 아니라

클라우드란 무엇인지 그리고 클라우드 모니터링의 필요성까지 알아보았습니다.


 

 클라우드 컴퓨팅 플랫폼은 사용자에게는 보이지 않지만 중앙의 서버 컴퓨팅 자원을 활용해서 서비스를 받을 수 있게 하는 플랫폼이며, 개발의 신속성과 자원의 활용성, 운영의 유연성이라는 특징을 가지고 있습니다. 이런 특징들 때문에 클라우드는 국내외를 막론하고 그 시장이 매우 커지고 있는데요. 최근 IT 자산을 클라우드로 이관하는 고객사가 점점 더 많아지고 있는 추세입니다. 하지만, IT 자산을 클라우드로 이관한다고 해서 클라우드의 가장 큰 장점인 IT 운영의 유연성(Scalability, Availability)을 바로 확보하기는 어렵습니다. 기존의 서버와 스토리지 등 물리적인 인프라마 클라우드로 이전했을 뿐 애플리케이션은 예전과 동일한 방식으로 운영을 할 수 밖에 없기 때문입니다. 그래서 클라우드에서의 IT 운영상의 장점을 최대한 취할 수있는 방법으로 MSA(Micro Service Architecture)가 등장했고, 이어서 컨테이너 기반 운영환경인 Docker와 Kubernetes가 등장하게 되었습니다. 이렇게 클라우드의 이점을 최대한 활용하는 애플리케이션 구축 및 실행 방법을 ‘클라우드 네이티브 아키텍처’라고 부릅니다.

 

 

 위와 같은 클라우드 네이티브 아키텍처로 구성된 IT 환경에서, IT 운영 환경을 효과적으로 모니터링 하기 위해 필요한 요건들은 다음과 같습니다.
1. 다양한 클라우드 컴퓨팅 플랫폼
 : 퍼블릭 클라우드, 프라이빗 클라우드, 하이브리드 클라우드, 멀티 클라우드 등 다양한 클라우드 환경에서도 모니터링 서비스를 제공할 수 있어야 합니다. 
2. 서비스 탄력성과 확장성
 : 클라우드에서는 필요 시 새로운 서버 인스턴스가 생성되기도 하고 기존에 운영되던 서버 인스턴스가 관리자에 의해 삭제되기도 하는데, 수시로 변경되는 탄력적인 IT 운영 환경을 실시간으로 모니터링 할 수 있는 기능이 필요합니다.
3. 컨테이너 기반 클라우드 네이티브 아키텍처
 : 클라우드 네이티브 환경에서는 컨테이너 등 기존에 없었던 새로운 개념이 등장함으로 기존 방식으로는 End-to-End 모니터링의 한계가 있고, 물리 노드에서 가상화 레이어, 그리고 애플리케이션 영역까지 Full Stack 모니터링이 가능해야 합니다. 그리고 관리해야 하는 객체가 많아지고 레이어가 복잡해짐에 따라 모니터링을 효율적으로 하기 위해 인공지능(AI)기반의 고도화된 기술이 필요합니다.
4. 효율적이지만 복잡한 MSA
 : 마이크로 서비스 아키텍처의 특성 상 서비스 간 복잡한 호출 관계와 높은 상호 의존성이 있습니다. 따라서 전체적인 관점에서부터 상세 서비스 모니터링까지 Drill Down방식으로 상세 모니터링을 지원해야 합니다. 
 

 

그럼 이제 인터맥스 클라우드(InterMax Cloud)를 알아볼까요?

 

 인터맥스 클라우드는 클라우드 환경의 대규모 관제에 효과적인 모니터링 기능을 제공하여, 클라우드 IT 운영의 효율성을 극대화 하는 솔루션인데요. 대규모 클라우드 환경에 적합한 아키텍처 구성으로 다음과 같은 특장점을 가지고 있습니다.

1. 다차원 토폴로지

 : 레이어 별 체계적인 모니터링을 통해 클라우드 전체 서비스 레이어의 가시성을 확보하였으며, 3D 아키텍처 토폴로지 뷰로 직관적인 모니터링이 가능합니다.

2. AI 기반 Anomaly Score

 : 복잡한 환경 속에서도 문제가 발생한 인스턴스의 이상치를 탐지하여 빠르게 사전 인지를 도와 장애 없는 서비스 운용을 가능하게 해줍니다.

3. AI 기반 희소로그 분석

 : 다수 컨테이너 관제에 필수적인 Smart 로그 분석을 지원하여 장애의 효과적인 원인분석이 가능합니다.

4. 컨테이너 기반 Agent 설치

 : Agent 자체도 컨테이너로 작성되어 설치가 손쉬울 뿐만 아니라, 모니터링 대상 자동관리가 가능해 전사 시스템 관리의 편의성을 제공합니다.

 

인터맥스 클라우드와 함께 라면 소수의 운영인력으로 대규모 클라우드 환경 통합 관제가 가능하겠죠?

발표자료는 여기에서 확인하실 수 있습니다 :)

 
 
 
AI 융합 비즈니스 개발 컨퍼런스
 

  

다음 날 18일에는 AI융합 비즈니스 개발 컨퍼런스에서 EXEM AIOps를 소개하였는데요.

이번 컨퍼런스는 ‘실제 사용할 수 있으면서 실용적인 AI’를 제시하는 컨퍼런스였습니다.

엑셈은 트랙1에 참여하였는데, 유료 세미나임에도 불구하고 많은 분들께서 자리를 채워주셨습니다.

 

트랙1의 전체 내용이 궁금하시다면 여기를 눌러주세용!

 

 

하이브리드 클라우드, 멀티 클라우드, MSA(Microservices Architecture) 등 IT 환경이 복잡다단해지고 있습니다.
모니터링해야 하는 IT 리소스의 수나 발생되는 운영 데이터의 양이 사람이 감당할 수 있는 수준을 넘어서고 있죠.
그래서 엑셈은 부하 예측, 이상 탐지, 원인 분석 등 AI를 활용하여 IT 운영을 지능화 하는 방법을 공유했습니다.
 

 

먼저 AIOps가 무엇인지 알아야겠죠?
 
 엑셈 뉴스레터를 꾸준히 보신 분들이라면 다 아실 내용일텐데요. AIOps는 AI와 Operation의 합성어 입니다. AI 기술을 IT 운영에 접목하여 운영을 지능화, 효율화 하는 것입니다. 엑셈은 국내 최초로 딥러닝 기반 AIOps 솔루션을 출시하였습니다. EXEM AIOps는 기업의 다양한 IT 인프라와 애플리케이션 데이터를 실시간으로 수집하여 부하 특성과 패턴을 학습하고, 상태를 예측하여 장애를 조기에 발견합니다. 이렇게 이상 징후와 장애 발생 시에 신속하게 조치할 수 있도록 하여 IT 운영자의 선제적 대응을 지원하는 IT 운영 자동화 솔루션입니다.
 

 

구체적으로 어떤 효과가 있을까요?

 

1. 지능형 모니터링 : 운영자에게 의존하던 기존 방식과 달리, 딥러닝 학습을 통해 더욱 진화한 자동화된 모니터링과 분석이 가능합니다.

2. 역동적인 지능형 알림 : Dynamic Alert 설정을 통해 능동적인 대응이 가능한데요. 정상 패턴과 다른 이상치 탐지 시에 지능형 알람으로 빠르게 알려줍니다.

3. 선제적 장애 대응 : 부하 예측, 이상 탐지, 근본 원인 분석을 통해 미래 상황을 예측 및 대비하여 선제적으로 장애 대응이 가능해집니다.

4. IT 운영 효율성 향상 : 사람의 개입을 최소화 하여 시간과 비용을 절감할 수 있으며, 관리/운영의 부담을 최소화 할 수 있습니다.

 

적용 사례도 함께 소개하며 발표를 마무리 지었는데요.

EXEM AIOps를 도입한다면 정말 똑똑한 IT 운영이 가능해질 듯 합니다.

발표자료는 여기에서 확인하실 수 있습니다 :)










기획 및 글 | 사업기획팀 박예영

현장 사진 | 사업기획팀 박예영






  [Semtong 138회] 

  EXEM in AI EXPO KOREA 2019

  다른 이야기도 궁금하시다면?

 


  · 엑셈 뉴스룸 | AI EXPO KOREA 2019 참가기


  · 엑셈 뉴스룸 | 엑셈이 매력적인 5가지 이유


  · 엑셈 Brand X | Core Value. #Individual


  · 엑기스 | 신제품 발표 다시보기


  · 엑셈 동호회 | 볼링 동호회


  · 아이참 | AI TECH 2019


  · 월간기술동향 | 똑똑한 쇼핑, 리테일테크


  · 원더풀 과학 | 우리는 어디서 와서 어디로 가는가?


  · Tech in Cinema | 라이온 킹


  · 신입이도 직딩구실 | 물음표 살인마 [납량특집]


 








엑셈 뉴스룸 | AI EXPO KOREA 2019 참가기

엑셈 뉴스룸 2019.07.10 13:44

 

 

 

무더운 여름, 엑셈이 나들이에 나섰습니다.

바로 제 2회 국제인공지능대전에 참가한 것인데요!

 

인공지능(AI)하면 절대 빼놓을 수 없는 엑셈이

신제품 EXEM AIOpsInterMax Cloud,

그리고 파트너사의 솔루션 DataRobotKNIME을 선보였습니다.

 

AI EXPO KOREA 2019 전시회 참가기, 지금 바로 시작합니다!

 


제 2회 국제인공지능대전(AI EXPO KOREA 2019)은 

“당신이 인공지능시대를 이끌 차세대 주인공입니다!”라는 슬로건으로 진행되었는데요.

전시 부스 외에도 다양한 동시 개최 행사가 마련되어 다채롭게 구성되었습니다.

 

먼저 엑셈이 준비한 부스를 함께 보실까요?

 

 

 

 

제품 소개


AI 기반 IT 운영 지능화 솔루션

EXEM AIOps는 기업의 다양한 인프라와 애플리케이션 데이터를 실시간으로 수집하여 부하 특성과 패턴을 학습하고, 장애 상황을 예측함으로써 

IT 운영자의 선제적 대응을 지원하는 인공지능(AI) 기반 IT 운영 지능화 솔루션입니다.

<브로슈어 다운로드 받기>

 

 

 

클라우드 네이티브 아키텍처 통합관제 솔루션

InterMax Cloud는 하이브리드 클라우드 환경의 대규모 IT 인프라와 서비스를 통합적으로 관제할 수 있는

클라우드 네이티브 아키텍처 기반 성능 모니터링 솔루션입니다. 

 

머신러닝 자동화(AutoML) 솔루션

머신러닝 모델 구축 전 과정에 대한 자동화를 지원하며, 동시에 수백 개의 모델을 한 번의 클릭 만으로 구축이 가능하고

그 중 최적의 알고리즘을 찾아주는 머신러닝 자동화 전문 솔루션입니다.

 

<브로슈어 다운로드 받기>

 

 

 

워크플로우 기반 Total 분석 플랫폼

데이터 수집, 정제 및 변환, 모델링, 배포, 시각화까지 모든 과정을 워크플로우 기반으로

손쉽게 분석할 수 있도록 하는 드래그 앤 드롭 방식의 분석 플랫폼입니다. 

 

 

이벤트


전시회에 이벤트가 없으면 섭하죠?

 

 

부스 방문 이벤트로는 추첨을 통해 스타벅스 커피 쿠폰을 드리고~

제품 상담 이벤트로는 무더위를 날려줄 휴대용 선풍기와 고급진 엑셈 다이어리까지 드렸습니다!

 
 

부스 현장
 

 

눈코 뜰 새 없이 지나간 3일이었는데요.

모두들 열심인 모습입니다.

사진만 봐도 엑셈에 대한 관심이 느껴지시죠?

 

 

매 시간 진행된 데이터로봇 데모 시연에도 많은 분들께서 참여해주셨습니다.

 

👍

  

엑셈 부스가 인기가 많아서였을까요?

한 방송사에서 엑셈의 신제품을 취재하기도 했답니다.

 

(고생해주신 강인규 이사님, 감사합니다!)

 
 
 
세션 발표

 

 

엑셈의 상세한 기술 소개 세션도 절대 놓칠 수 없는데요.

엑셈 AI옵스와 인터맥스 클라우드를 소개하는 세션에 참가하였습니다.

세션 내용이 궁금하시다고요? 여기를 눌러 확인해보세요~

  

 

정말 빠르게 지나간 3일이었습니다.

많은 분들을 만나 엑셈을 소개하고,

또 큰 관심을 받았습니다.

 

무더운 7월, 저희 엑셈을 찾아 주신 모든 분들께

다시 한번 감사의 인사를 드립니다.

 

 

 

(소곤소곤) 9월, 엑셈이 나주에 출동한다는 얘기가?

 
 
 

 

 

 


기획 및 글 | 사업기획팀 박예영

현장 사진 | 사업기획팀 홍성덕, 박예영






  [Semtong 138회] 

  EXEM in AI EXPO KOREA 2019

  다른 이야기도 궁금하시다면?

 


  · 엑셈 뉴스룸 | AI EXPO KOREA 2019 참가기


  · 엑셈 뉴스룸 | 엑셈이 매력적인 5가지 이유


  · 엑셈 Brand X | Core Value. #Individual


  · 엑기스 | 신제품 발표 다시보기


  · 엑셈 동호회 | 볼링 동호회


  · 아이참 | AI TECH 2019


  · 월간기술동향 | 똑똑한 쇼핑, 리테일테크


  · 원더풀 과학 | 우리는 어디서 와서 어디로 가는가?


  · Tech in Cinema | 라이온 킹


  · 신입이도 직딩구실 | 물음표 살인마 [납량특집]


 








엑셈 뉴스룸 | EXEM AIOps

엑셈 뉴스룸 2019.04.10 14:53



딥러닝 기반 AIOps가 국.내.최.초로 출시되었습니다!

기존 엑셈의 주 고객이었던 금융업 뿐만 아니라, 제조업 등 다양한 분야까지 확대 적용이 가능한!

국내 최초 AIOps 솔루션 EXEM AIOps를 오늘 꼼꼼히 살펴보겠습니다 :)

 

 AIOps란?

AI기술을 IT 운영(Operation)에 접목한 것으로, “IT운영을 위한 인공지능(Artificial Intelligence for IT Operations)”을 뜻합니다. (Algorithmic IT Operations 라고도 합니다.) IT운영에 AI를 도입함으로써 그 운영을 좀 더 지능화, 효율화 하는 것이죠.

※ AIOps에 대한 내용은, 여기를 눌러 한번 읽어보고 오시면 좋습니다.

 

IT 인프라 운영자는 장애 없이 시스템을 안정적으로 운영하기 위해 365일, 24시간 철저한 모니터링과 점검을 수행하고 있습니다.

그러나 점검해야 할 시스템은 많고, 기타 업무로 인해 점검 시기를 놓치거나 모니터링을 하지 못하는 경우도 종종 발생합니다.

아무래도 사람이 하는 일이다 보니, 매일 대기모드로 있어야 하는 운영자들은 정말 피곤하겠지요.

그래서 숙련된 운영자처럼 시스템의 이상패턴을 미리 감지하고, 알려주는 AIOps 솔루션이 꼭 필요합니다.

 
 

 EXEM AIOps  - IT 자원에 대하여 최적화된 똑똑한 IT 서비스 운영관리 솔루션

<EXEM AIOps, Real Time Monitoring 대시보드>


EXEM AIOps는 기업의 다양한 IT 인프라와 애플리케이션 데이터를 실시간으로 수집하여

부하 특성과 패턴을 학습하고, 상태를 예측하여 장애를 조기에 발견합니다.

또한 이상징후와 장애발생 시 신속하게 조치할 수 있도록 하여 IT 운영자의 선제적 대응을 지원합니다.

 


그리고 지금까지의 통계 분석 방법이나 룰 기반의 분석 대응이 아닌 인공지능(AI)을 활용하며,

실시간 모니터링 대상 데이터의 성격과 분석 목적에 맞는 학습 모델을 선택 적합니다.

 

 

딥러닝/머신러닝을 이용하여 데이터로부터 부하의 인과관계 및 트렌드를 학습하여 미래의 부하 수치를 추정합니다.

Moving Average, Exponential Smoothing 방식으로 각 지표에 대한 베이스라인을 산출하여 이상 탐지 및 예측 기준으로 사용합니다.

K-Means Clustering 알고리즘 방식을 통해 이상 패턴을 보이는 트랜잭션을 감지합니다.

Causality Analysis 기법으로서 서로 다른 데이터 간의 상관관계를 분석하고 특정 문제에 대해 인과관계가 높은 요인을 도출합니다.

 

또한 EXEM AIOps는 진화된 모니터링과 관리 체계를 지원하여 IT운영 업무의 안정성 향상에 기여합니다.

 

 

특히 장애 발생 후 수분 내에 근본 원인을 도출함으로써 똑똑한 IT 운영관리가 가능해집니다.

 

 

구축효과 & 주요기능

EXEM AIOps를 사용하면 AI 기반 지능형 모니터링이 가능하고, 미래 상황을 미리 예측함으로써 선제적으로 장애 대응이 가능합니다.

결국 IT 인프라 관리/운영의 부담을 최소화 하고, 시간과 비용이 절감되므로 IT 운영의 효율성이 향상됩니다.

 

 

이제 본격적으로 EXEM AIOps의 주요기능에 대하여 알아볼까요?

#실시간 기능

1. 부하 예측(Load Forecast) : 과거의 수집 데이터를 인공지능이 학습하여 래의 상황을 예측


과거 3개월간 System Metric 데이터로 인공지능 학습

지난 1시간 동안의 System Metric 데이터로 앞으로 1분, 30분, 1시간 뒤의 부하량 예측

이미 알고 있는 부하 패턴 또는 Dynamic Baseline을 통해서 그려진 부하 패턴과 미래의 부하 예측치가 유사하게 흘러가는지 확인

부하의 이상 징후가 어느정도 영향도를 가질지 예측이 가능하며, 이를 바탕으로 사전 대응 여부 판단

AI가 지속적으로 부하를 예측하고 이상 징후를 감시하므로 모니터링에 대한 사용자의 개입을 최소화

 
2. 장애 예측(Failure Forecast) : 수집된 데이터의 트랜드를 예측하여 미래 특정 시점에 장애가 발생할 지를 미리 알려줌

과거 데이터와 추이를 학습하여 미래 값을 예측하고 임계치에 따라 필요한 액션(알람 등) 수행

• 실 데이터를 학습하여 적용하므로 기존 머신러닝 방식 대비 예측 정확도 향상 예) Tablespace full, Disk full, CPU 과사용 등


3. 이상 탐지(Anomaly Detection) : 과거 데이터를 기반으로 신뢰 궤적을 그려 관측치가 그 범위를 벗어나는 경우 이상으로 간주

익숙하지 않은 이상 그래프 파형 감지 시

시스템이 정상적으로 운영되는 경우 시스템 주요 지표 값이 급격하게 변하는 경우는 거의 없으나,
  장애 상황에서는 특정 지표의 값이 갑자기 증
가하거나 갑자기 떨어지는 등 급격하게 변하는 경우가 빈번

 DB time, Active Session Count 등의 시스템의 주요 지표에 대한 급작스런 증가와 감소를 탐지하여 실시간으로 시스템 관리자에게
    이상 징후를 알려줌으로써 장애에 대한 빠른 대응 가능

 

#장애/부하 분석

1. 부하 패턴 분석(Load Pattern Clustering) : 부하 패턴을 몇개 유형으로 범주화하여 학습, 상황별로 임계값을 다르게 설정 (잘못된 알람 최소)

시스템이 매일 겪고있는 부하 패턴에 대해 직관적으로 시각화 -> 관리/운영의 편의성 제공

부하에 대한 군집(Clustering)화를 통하여 부하 패턴 분석

부하 패턴만 보더라도 어떤 상황인지 쉽게 인지 가능

 

2. 인과 관계 분석(Causality Analysis) : 이상 발생 후, 인공지능에서 해당 문제에 대한 연관 지표 학습을 통하여 증상/징후를 찾아줌

반복적으로 발생하는 패턴에 대한 인공지능 학습

이상탐지/알람 발생 시 연관성 있는 지표 자동 추출/분석

특정 지표의 문제가 다른 지표와 관련이 있는지 확인

▶ 문제에 대한 증상/징후 확인 후 관리자의 신속한 대응 가능

 

3. 근본 원인 분석(Root-Cause Analysis) : 장애 발생 시, 인공지능 Rule Engine에서 장애의 근본 원인을 찾아줌

 사전에 분석 전문가가 장애의 원인에 대해 분석하는 방법을 Rule로 시스템에 등록
 지연 구간 상세 분석 및 개별 시스템과의 연관 분석을 통한 근본 원인 분석 기능
  - 지연구간 분석: E2E Call-tree 분석을 통한 지연 유발 시스템 분석
  - 연관 분석: 지연 구간에 따른 개별 시스템의 지표 분석
  - 근본 원인 분석: 문제 시스템의 상세 원인 분석
 
 
#지능형 알람 설정(Smart Alert)
과거의 수집 데이터 학습을 통한 Automatic Alert Threshold 설정

 역동적인 부하에 맞게 적절한 임계치가 자동으로 설정되어 적절한 알람이 발생되는 기능(=Smart alert)

 기본 baseline만 설정하면 그 범위 이상의 경우 알람 발생

실시간 WAS, DB, 트랜잭션, 업무 별 AI 기반 사전 알람 발생 시 연계 분석 기능

 “이상 트랜잭션 탐지” 상세 분석 화면 연계,  트랜잭션 응답 시간 지연 시 해당 TID의 상세 분석 뷰로 연계,
    그 외 기본 알람은 “알람 발생 내역”으로 연계

 

적용사례

지난 해부터 엑셈은 여러 기업에서 PoC를 진행하였는데요, 몇가지 사례를 보여드리겠습니다.

1. A

기존 InterMax를 사용하던 기업이었는데요. 이상탐지 기능을 통해 정확한 알람을 수신하게 되어 운영의 안정성을 높였다는 평가를 받았고, 

장애발생 시 근본 원인 분석을 통해 해결책을 수립하게 되었습니다. 또한 부하 예측 기능을 통해 장애를 미연에 방지하게 되었습니다.

 

 

<A사 적용 화면>

2. B사

운영자에 의존하여 IT 자산을 모니터링하고 장애 발생 시 문제의 원인을 분석했던 대응 절차를 자동화하여, 장애를 인지하는 시점을 앞당기고 

장애 원인 분석에 걸리는 시간을 단축하여 한 단계 진화된 IT 운영 관리 체계 구축이 가능하다는 것을 입증하였습니다.

 

 


<적용 화면 – 근본 원인 분석>

 

 

 

국내최초 AIOps 솔루션 EXEM AIOps가 금융권, 제조업 등 다양한 업계에서 발휘할 활약들을 기대하면서!

많은 관심과 응원 부탁드립니다 :)

 

 

EXEM AIOps에 대하여 궁금하신가요? 여기를 눌러 문의해보세요!







기획 및 글 | 사업기획팀 박예영


엑기스 | AIOps가 뭐지?

기술이야기/엑.기.스 2019.03.07 12:59

 

 

#1. AIOps 용어 등장

 AIOps는 풀어 쓰면 ‘Artificial Intelligence for IT Operations’ 또는 ‘Algorithmic IT Operations’입니다. 2014년 Gartner 보고서에 등장한 용어로, IT 운영에 AI를 도입함으로써 그 운영을 좀 더 지능화, 효율화하는 것을 뜻합니다.

<The History Of AIOps, 출처: Loom Systems>

 

 

#2. AIOps의 등장 배경

 과거에는 ICT 인프라가 모놀리틱 아키텍처로 단순했습니다. 따라서 WAS나 데이터베이스를 잘 모니터링하는 것만으로도 ICT 운영팀 임무를 충분히 달성할 수 있었습니다.

 기술이 발전하면서 SOA(Service Oriented Architecture)가 도입되었고, 근래에는 MSA(Microservices Architecture)가 유행하고 있습니다. 이는 운영/관제 대상 시스템이 다양하게 많아진 것을 의미하고, 메트릭, 로그 등 운영 데이터의 양도 급격히 늘어나게 되었다는 것을 말합니다. 그 만큼 ICT 운영이 어려워진 것이죠. 

 이제는 단순히 여러 관제 도구를 도입하고, 운영 요원을 늘린다고 해서 안정적 서비스 제공이 보장되지 않습니다. ICT 운영에 AI를 도입함으로써 안정적 서비스 보장과 운영 요원 피로도 감소, 운영 비용 절감 등을 꾀하고자 AIOps라는 개념이 등장하였습니다.

 

<AIOps Platform Enabling Continuous ITOM, 출처: Gartner>

 

 

#3. AIOps 시장 전망

 아래 그림에서 알 수 있듯이, 2018년 Gartner는 향후 5~10년 내에 AIOps가 하나의 기술 또는 제품으로서 시장에 자리 잡을 것이라고 예견했습니다.

<Hype Cycle of ICT in India 2018, 출처: Gartner>

 

또한 한국IDC에서도 2019년 국내 ICT 시장에서도 AIOps가 10번 째로 유력한 기술이나 트렌드가 될 것이라고 전망했습니다.

 

 

<한국IDC, 2019년 국내 ICT 시장 10대 전망 발표>

#10 AI기반의 IT 운영(Operations): IT 지출을 축소하고, 기업의 IT 민첩성을 개선하며, 혁신을 가속화할 수 밖에 없게 되면서, 60%의 CIO가 2021년까지 IT 운영, 툴, 프로세스에 있어 데이터 및 AI를 공격적으로 적용하게 될 것이다.

 

시장 측면에서 보면, AIOps 시장 크기는 세계 기준 2017년 약 2조 원에서 2025년 약 24조 원으로 매년 36.2% 성장할 전망입니다. 국내 시장이 세계의 1%라고 가정하면, 2017년 200억 원 시장에서 2025년 2,400억 원 시장으로 성장하는 것이죠.

<Global AIops Platform Market Outlook, 2017 & 2025 ($Billion), 출처: COHERENT MARKET INSIGHTS, 2018>

 

 

#4. 국내외 AIOps 벤더 현황

 해외에는 미국을 비롯한 30여개의 AIOps 벤더가 존재하고, 이 중 BMC, Splunk는 이미 국내에 진출해 있는 상황입니다. 하지만 국내에는 아직 명시적으로 AIOps를 표방하는 벤더는 엑셈 이외에 잘 보이지 않습니다.

 

 - 미국: AppDynamics, BMC, CA, Dynatrace, FixStream, IBM, InfluxData, Loom Systems, Moogsoft, Splunk, VMware 등 20여 벤더

 - 영국: Micro Focus 등

 - 네덜란드: StackState 등

 - 이스라엘: Anodot, VNT Software 등

 - 인도: HCL, VuNet 등

 - 일본: Brains Technology 등

 

 엑셈은 이미 지난 해에 자사의 MaxGauge, InterMax에 AIOps 기능을 탑재하는 형태로 개발을 진행해 왔는데요. 올 해 초에는 국내 모 금융사에 PoC를 성공적으로 마친 상황이고, 이제는 ‘InterMax AIOps’ 이름으로 본격 제품화를 꾀하고 있습니다.

 

 

#5. AIOps 기대 효과

 

<Predict and Prevent Operational Issues with AI, 출처: Splunk>

 

 1) 장애 자동 감지, 자동 복구를 통해 ICT 운영 요원의 피로도를 감소시킨다.

 2) 선제적으로 장애에 대응하게 함으로써 MTTR(Mean-Time-to-Repair)을 획기적으로 줄인다.

 3) MTTR을 줄이는 만큼 고수준의 SLA(Service Level Agreement)를 보장하게 된다.
 4) 이는 이용자의 서비스 이탈을 막고, 고객 신뢰가 높아지는 요인이다.
 5) 공공 기관일 경우, 이미 대국민 서비스가 세계 상위 수준이나 이를 더욱 공고히 할 수 있다.
 6) 해외 AIOps 벤더들이 국내로 진출하는 속도를 저감시킬 수 있다.
 7) 중국, 동남아 등으로 AIOps 제품을 수출함으로써 ICT 한국의 위상을 수성할 수 있다.
 8) 버려지는 운영 데이터를 관련 기업들에 제공, AI 연구에 재사용할 수 있게 된다.
 9) AIOps 구축 사업, 운영 데이터 거래 등이 활성화 되면서 새로운 시장이 창출된다.
 

 ICT 운영 요원은 퇴근을 해도, 휴가를 가도 늘 ICT 인프라가 잘 동작하고 있는지 신경을 써야 하는, 24시간 365일 대기 모드로 있어야 하는 직업입니다. AIOps의 도입으로 이 들의 삶도 좀 더 편안해지지 않을까 싶네요.

 

 



AIOps에 대하여 더 궁금하다면? 여기를 눌러 문의해보세요!




기고 | AI사업본부 최영수 이사

편집 | 사업기획팀 박예영

월간기술동향 | Oops! 아니고 AIOps!



최근 급 부상하고 있는 AIOps에 대해 알고 계신가요? 가트너는 지난 2017년에 "2019년까지 세계 기업의 25%가 2~3가지 중요 IT업무를 지원하는 AIOps 플랫폼을 구현할 것"이라고 예측하였는데요, 이번 시간에는 AIOps에 대하여 살펴보겠습니다.



 AIOps란? 

AIOps <출처: Gartner, 2017>

 AIOps는 AI 기술을 IT 운영(Operation)에 접목한 것으로, “IT운영을 위한 인공지능(Artificial Intelligence for IT Operations)”을 뜻합니다. (또는 Algorithmic IT Operations 라고도 합니다.) AIOps는 빅데이터 분석과 머신러닝, 그리고 기타 AI 기술을 활용해 IT인프라의 문제를 파악하고 해결책을 제시하는 과정을 자동화 합니다. 사람이 직접 개입하는 대신 AI를 통해 실수를 줄이고, 보다 더 효율적으로 IT 인프라를 운영하는 것이죠. 날로 복잡해지는 여러 자산을 관리함에 있어서 인공지능을 통해 운영자의 시간과 노력을 줄여줄 수 있습니다. 




 AIOps의 구성요소 

<출처: DZone>

 AIOps를 이루는 두 가지 핵심 요소는 빅데이터와 머신러닝인데요, IT운영 과정에서 생산되는 분산된 각종 데이터들을 분석하여 머신러닝을 통해 지속적으로 적용함으로써 IT운영의 자동화를 이루게 됩니다. 


The technologies that make up an AIOps platform <출처: bmc>

 조금 더 자세히 말하면, 우선 검증된 데이터가 필수적입니다. 실제 기업 환경에 적용되어 신뢰할 수 있는 데이터가 양적으로도 질적으로도 충분해야 합니다. 그리고 수집한 데이터들을 분석한 후에 인공지능이 이 데이터들을 효과적으로 학습해야 하죠. 이 역시 꽤 긴 시간이 필요한 과정입니다. 이렇게 구현된 인공지능은 실제 IT 서비스로 구체화되어야 비로소 완성되는 것입니다.




 AIOps의 활용 

AIOps Platform Enabling Continuous Insights Across IT Operations Management <출처: Gartner, 2018>

 가트너는 위 그림과 같이 AIOps가 IT운영 전반에 걸쳐 지속적인 통찰을 가능하게 한다고 설명했습니다. AIOps에서 Logs, Text, Wire, Metrics, API등의 데이터 유형들을 처리하여 다음과 같이 활용할 수 있습니다.

▶ Causal Analysis (인과관계 분석)

▶ Anomaly detection (이상 탐지)

▶ Performance analysis (성과 분석)

▶ Prediction(예측)

▶ Correlation and contextualization (상관관계와 맥락화)

▶ Intelligent Remediation(지능적 개선)




 AIOps의 도입 효과 

그렇다면 AIOps 도입 후 얻을 수 있는 효과는 무엇일까요?

1. 업무의 효율성 증가 

 AIOps는 일상적이고 반복적인 업무를 자동화하여 업무의 효율성을 증가시킵니다. 이 덕분에 운영자는 반복적인 업무 수행 대신 좀 더 운영을 효율화 할 수 있는 업무에 집중할 수 있게 됩니다.

2. 운영 비용 감소 & 안정적이고 예측 가능한 인프라 제공

 AIOps는 분석과 예측을 통해 최적화된 자원을 사용함으로써 운영 비용을 최소화할 수 있습니다. 또한 보다 더 안정적이고 예측 가능한 운영이 가능해집니다.

3. 기타 부서와의 협업 최대화

 AIOps는 각 팀에게 관련 데이터를 제공합니다. 그래서 IT팀이 비즈니스 부서와 데이터 사일로 없이 원활한 의사소통이 가능해지고, 협업을 효율적으로 할 수 있게 되죠. 데이터를 기반으로 한 의사결정이 가능함으로써 기업은 새로운 트렌드에 민감하게 반응할 수 있게 됩니다. 

 ※ 데이터 사일로(silo): 데이터가 전체적으로 통합되지 않고 개별 부서나 사업 부문별로 고립적으로 활용되는 것




본문 외 reference

Gartner, Market Guide for AIOps Platforms

IDG, IT 인프라 운영의 새로운 기준

TechTarget, AIOps






기획 및 글 | 사업기획팀 박예영