본문 바로가기
엑셈 경쟁력/엑.기.스

엑기스 | 신간 출시! KNIME을 활용한 빅데이터 분석

by EXEM 2019. 8. 9.

  

  

 

엑셈에서 오랜만에 책이 나왔습니다! 

데이터 분석에 관심이 있는 분들을 위해 엑셈 빅데이터사업본부에서 두 팔을 걷어 붙이고 책을 썼다고 하는데요.

어떤 책인지 지금 바로! 공개합니다 :)




“KNIME을 활용한 빅데이터 분석”

 

<(Click 하나로 끝내는 데이터 분석 KNIME) KNIME을 활용한 BIG DATA 분석>

 

“(Click 하나로 끝내는 데이터 분석 KNIME) KNIME을 활용한 BIG DATA 분석” 도서가 출판되었습니다! 빅데이터 분석팀 주관으로 집필된 도서는 데이터 분석을 위해 분석 도구(Tool, SW)를 처음 접하는 학생이나 현업담당자들이 KNIME을 활용하여 데이터 분석에 쉽게 접근할 수 있는 정보 제공을 목적으로 작성되었습니다. 그렇다면 데이터 분석 도구인 KNIME은 무엇일까요? 먼저 KNIME이 무엇인지부터 차근차근 알아보겠습니다.

 

 

 

나임(KNIME), 데이터 사이언스와 머신러닝 플랫폼의 선두 주자 

 

 

 나임(KNIME, Konstanz Information Miner)은 가트너의 2018 Magic Quadrant에서 “데이터 사이언스와 머신러닝 플랫폼‘ 분야에서 선두 그룹에 포함된 소프트웨어 중 하나입니다. 독일의 Konstanz university의 소프트웨어 엔지니어 팀이 Java로 개발하였으며, 현재 KNIME Analytics Platform은 4.0 버전, KNIME Server은 4.9 버전까지 출시되어 활용되고 있습니다.

 

 나임은 비주얼 워크플로우(Visual Workflow) 기반으로 다양한 데이터 소스(Database, File, Hadoop 등)로부터 읽기, 전처리, 변환, 분석, 평가, 시각화 등의 분석 전 과정을 드래그-앤-드롭(drag-and-drop) 방식으로 쉽게 작업할 수 있는 토탈(Total) 분석 플랫폼입니다. 비주얼 워크플로우의 특징인 빠른 구현 속도, 쉬운 학습 난이도, 높은 모듈 의존도 등의 특징을 가집니다.

 

<KNIME의 구성>

  

 나임은 크게 KNIME Analytics Platform과 KNIME Server로 구성되어 있습니다. 추가적으로 나임과 나임 파트너 그리고 나임 사용자들이 제공 및 공유하는 다양한 확장 및 통합 기능을 활용할 수 있는 환경인 KNIME Extensions, Partner Extensions, Community Extensions과 KNIME Integrations을 제공합니다. 

 

 “KNIME을 활용한 데이터 분석” 도서는 KNIME Analytics Platform을 중심으로 집필되었기에, KNIME Analytics Platform에 대해서 알아보겠습니다. KNIME Analytics Platform은 데이터 과학 응용 프로그램 및 서비스 구현을 위한 오픈 소스 소프트웨어 입니다. 데이터를 이해하고 활용할 수 있도록 직관적이며 재사용이 가능한 구성 요소로 설계되어 있으며, 사용자의 Desktop에서 사용할 수 있는 분석 플랫폼입니다. 데이터 읽기(Load), 통합(Integrate), 변환(Transform), 분석(Analyze), 시각화(Visualize) 등의 기능을 수행할 수 있습니다. KNIME Analytics Platform에서 나임 확장(KNIME Extensions)을 통하여 데이터 접근, 처리, 기계학습 알고리즘, 시각화에 활용되는 다양한 기능을 추가적으로 활용할 수 있습니다. 그리고 나임 통합(KNIME Integration)을 통하여 딥러닝을 위한 Keras, Tensorflow, 고성능 기계학습을 위한 H2O, 대용량 데이터 처리를 위한 Apach Spark와 스크립트 언어인 R과 Python을 활용할 수 있는 환경을 제공합니다. 

 

 

 

"KNIME을 활용한 데이터 분석" 도서 구성

 

<"KNIME을 활용한 데이터 분석" 목차>

 

 “KNIME을 활용한 데이터 분석” 도서는 데이터 분석을 위해 KNIME을 처음 접하는 학생 또는 현업 담당자를 대상으로 집필된 기본서 입니다. 도서는 KNIME에 대한 소개로 시작됩니다. 

• 1장 KNIME 설치 및 환경설정에서는 KNIME Analytics Platform 설치 방법, 화면구성, 환경 설정 및 메모리 설정에 대하여 설명합니다. 

• 2장 데이터 가공에서는 외부 데이터 가져오기, KNIME Analytics Platform 내 데이터 외부로 내보내기 등의 데이터 읽기와 내보내기에 대한 내용과 데이터 처리, 조작, 추출, 변수 생성 등의 데이터 처리 과정에 대하여 설명합니다. 

• 3장 데이터 탐색에서는 데이터를 수치적으로 탐색하는 방법과 다양한 그래프를 활용하여 시각적으로 탐색하는 방법에 대해 설명합니다.

• 4장 데이터 분석에서는 대표적인 머신러닝 알고리즘인 선형 회귀분석, 로지스틱 회귀분석, 의사결정나무, 랜덤포레스트, 신경망(MLP) 등의 지도학습과 연관성 분석, K-Means 군집분석, 계층적 군집분석 등의 비지도학습을 KNIME Analytics Platform에서 구현할 때 필요한 노드에 대한 설명과 실습 예제를 통한 모델 구현 절차와 결과 해석 방법에 대하여 설명합니다. 

• 마지막으로 부록 About KNIME Server에서는 KNIME Server의 특징에 대한 설명과 KNIME을 활용하면서 참고할 수 있는 웹 사이트에 대한 정보를 제공합니다. 

 

 데이터 분석 과정인 데이터 가공, 탐색 및 분석에 활용되는 노드를 바탕으로 기능, 옵션 정의, 예시 및 예제 데이터를 바탕으로 단계적 실습 방법을 설명하고 있으며, 이를 바탕으로 KNIME Analytics Platform을 처음 접하는 독자들도 쉽게 따라하며 데이터 분석 및 KNIME Analytics Platform 활용 방법을 익힐 수 있게 구성되어 있습니다.

 

 

 

"KNIME을 활용한 데이터 분석" 도서를 활용한 KNIME 학습 및 활용

 

<OWLEYE 사이트(좌), 오프라인 세미나(우측상단), 웨비나(우측하단)>

 

 마지막으로 “KNIME을 활용한 데이터 분석” 도서를 활용하여 보다 효율적으로 KNIME Analytics Platform의 활용 방법을 익히고, 데이터 분석 과정에 대해 학습에 활용할 수 있는 웹 페이지와 웨비나, 오프라인 교육 정보를 소개합니다. 도서의 내용이 쉽게 구성되어 나임을 학습하는데 별 어려움이 없을 것이지만, 온라인 교육 컨텐츠의 활용이나 KNIME을 활용하여 데이터 분석을 수행하는 분석가가 진행하는 오프라인 교육을 활용한다면 학습의 효율성이 더 높아질 것입니다. 

 

  먼저 울아이(OWLEYE) 웹 페이지를 소개합니다. 아울아이는 엑셈 빅데이터 분석팀에서 운영하는 웹 페이지입니다. “KNIME을 활용한 데이터 분석” 도서의 실습 데이터를 제공하며, 도서를 활용하여 KNIME을 학습하다가 생긴 의문점이나, KNIME 활용 과정에서 혼자 해결하기 어려운 이슈에 대한 질문을 게재하면 KNIME을 활용하는 분석가들이 해당 질문에 대한 답변을 제공합니다. 그리고 KNIME 버전 업과 같은 새로운 소식과 업종별 활용 사례에 대한 정보를 제공합니다.

 

 그리고 엑셈 아카데미에서 진행하고 있는 웨비나와 오프라인 교육이 있습니다. 이 교육 과정은 KNIME을 활용한 데이터 분석 경험이 있는 분석 전문가들이 진행하는 교육으로, 데이터 처리 및 시각화, 모델링 등의 내용을 다루는 교육과정입니다. 도서 집필에 직접 참여하고 데이터 분석 업무에서 KNIME 활용 경험이 있는 전문 분석가가 진행하는 교육이므로 도서 내용에 대한 질문 내용이나 KNIME Analytics Platform을 활용한 데이터 분석 노하우에 대하여 많은 정보를 얻을 수 있을 것입니다.

 

 지금까지 Total 분석 플랫폼인 나임에 대한 설명과 KNIME을 처음 접하는 분들에게 안내 표지판이 될 “(Click 하나로 끝내는 데이터 분석 KNIME) KNIME을 활용한 BIG DATA 분석” 도서에 대하여 소개하였습니다. 학습 시간과 활용에 오랜 시간이 소요되는 스크립트 기반의 분석 도구보다는 그래픽 기반의 사용자 환경과 워크플로우를 활용하는 KNIME을 활용하여 데이터 분석을 시작해 보시는 것은 어떨까요?

 






기고 | 빅데이터사업본부 정영진

편집 | 사업기획팀 박예영





 [Semtong 139회] PLAY WITH EXEM

다른 이야기도 궁금하시다면?

 

 

 🎯 엑셈 뉴스룸 | 엑셈 다트왕은 누구?

 🙆🏻 엑셈 뉴스룸 | 애자일 리더십

 👍🏻 엑셈 브랜드 스토리 Brand X | Mindset. #Philinnovator

 👨🏻‍💻 엑기스 | 신간 출시! KNIME을 활용한 데이터 분석

 





댓글