본문 바로가기
Chapter 2. Pandas 3편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 2.2.10 데이터 로딩과 저장 2.2.10.1 파일 읽기 pandas에는 표 형식으로 되어있는 포맷으로 되어진 파일을 읽을 수 있도록 기능을 제공하고 있다. 그 중에서 주로 사용하는 read_csv와 read_table만 사용해보자. 해당 예제파일은 쉼표로 구분 되어있기 때문에 read_csv을 사용해서 dataframe으로 읽어올 수 있다. Read_table의 경우는 구분자를 쉼표로 지정해서 읽어올 수 있다. In [1]: !cat ex1.csv Out [2]: ,a,b,c,d 0,1,2,3,4 1,5,6,7,8 2,9,10,11,12 3,13,14,15,16 In [3]: df = pd.read_csv('ex1.csv', index_col = 0) In [4]: df Out [5]: abcd 01.. 2022. 8. 25.
Chapter 2. Pandas 2편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 2.2 Time Series 머신러닝을 위한 Python 필수 라이브러리, Pandas 2편 2.2.3 원소선택, 인덱싱 2.2.3.1 series 인덱싱 인덱싱은 [위치] 또는 [‘인덱스명’]으로 인덱싱이 가능하다. In [1]: import pandas as pd import numpy as np In [2]: series_data = [2,4,6,8] In [3]: series_data = pd.Series(series_data) In [6]: series_data Out[6]: 0 2 1 4 2 6 3 8 dtype: int64 In [7]: series_data[1] Out[7]: 4 * 여러 값 인덱싱 및 슬라이싱 한 번에 여러 값을 인덱싱 하게 될 때는 위치나 인덱스명 둘 다 짝을 이루는 값.. 2022. 8. 25.
Chapter 2. Pandas 1편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 2.2 Time Series 머신러닝을 위한 Python 필수 라이브러리, Pandas 1편 Pandas란? Python Data Analysis Library의 약어이며, R을 모티브로 하여 만들어진 파이썬 라이브러리이다. 쉽고 직관적인 관계형 또는 분류된 데이터로 작업할 수 있도록 설계된 빠르고 유연하며 표현이 풍부한 데이터 구조를 제공하고 있다. Pandas가 필요한 이유는 Numpy의 ndarray 데이터 구조는 산술 연산 작업에서 포맷이 잘 정리된 데이터 타입을 위한 기능들을 제공하고 있지만, 현실 데이터는 생각보다 정돈이 잘 되어있지 않기 때문이다. Pandas는 데이터를 표(table) 형태로 처리할 수 있어서 수집된 데이터의 전처리 등 각종 데이터 핸들링을 쉽고 편하게 할 수 있다. 그렇기.. 2022. 8. 25.
스포트라이트 | InterMax mAPM, 더 이상 선택이 아닌 필수인 이유 포스트 코로나 시대에 살고 있는 우리에게 매우 익숙한 키워드 중 하나가 바로 ‘비대면’이다. 그간 오프라인에서 진행되어 온 수많은 활동들이 하나 둘 모두 비대면으로 빠르게 전환하고 있다. 그 변화의 중심에 모바일 애플리케이션이 있다. 연구에 따르면 지난 2017년부터 2021년까지 분야별 모바일 앱의 연평균 성장률이 크게 증가했다. 이는 앱 서비스를 제공하는 업체에게 좋은 소식이면서도 새로운 도전 및 과제를 직면하게 했다. 수많은 사람들이 매일 사용하고 있는 앱 서비스를 장애없이 운영해야만 고객 만족도가 올라가고 성공한 서비스가 될 수 있기 때문이다. 반면 예상치 못한 장애로 사용자에게 잦은 불편을 끼치면 고객 이탈을 피할 수 없다. 따라서 앱 서비스를 제공하는 업체라면 당연히 고려할 수 밖에 없는 것이.. 2022. 8. 25.
DB 인사이드 | PostgreSQL Setup - Installation 본 문서에서는 Linux와 Windows에서 PostgreSQL 여러 설치 방법에 대해 설명하도록 하겠습니다.※ 목차 ※ Install Overview Install PostgreSQL on Linux (CentOS - yum) Install PostgreSQL on Linux (CentOS - rpm) Install PostgreSQL on Linux (Ubuntu - apt) Install PostgreSQL on Linux (Ubuntu - dpkg) Install PostgreSQL on Linux (Source File) Install PostgreSQL on Windows (설치관리자) Install PostgreSQL on Windows (Binary File) 부록 1. 외부 접속을 위한 .. 2022. 8. 25.
DB 인사이드 | PostgreSQL Setup - Version & Utility ※ 목차 ※ PostgreSQL 버전 정책         1. PostgreSQL 릴리즈 정책         2. PostgreSQL 릴리즈 현황         3. PostgreSQL 버전 표기 PostgreSQL 업그레이드         1. PostgreSQL Minor 업그레이드         2. PostgreSQL Major 업그레이드 PostgreSQL 응용프로그램         1. pg_dump         2. pg_dumpall         3. pg_restore         4. pg_upgrade         5. initdb         6. pg_upgradecluster         7. pg_dropcluster         8. pg_lsclusters   .. 2022. 8. 25.
Chapter 2. Numpy 2편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 1편에서는 array의 생성 방법과 타입 확인, 텐서 차원 등을 실습해 보았다면, 2편에서는 array를 직접 적용하여 실습해 보고자 한다. 2-4. numpy 인덱싱, 슬라이싱, 전치행렬 2-4-1. 인덱싱 인덱싱은 Python 리스트와 동일한 개념으로 사용되고, ‘,’(쉼표)를 통해 각 차원의 인덱스에 접근이 가능하다. 그리고 Ndarray에서 원하는 좌표 또는 특정 데이터만을 선택하는데 유용하게 사용된다. 이때 인덱싱을 할 때 0번부터 인덱스가 시작하는 것을 주의하고, 원하는 축을 지정하려면 axis를 통해 선택할 수 있다. 인덱싱 종류로는 '특정 데이터만 추출', '슬라이싱', '팬시 인덱싱', '불리언 인덱싱' 등이 있다. 인덱싱 및 슬라이싱 '특정 데이터만 추출'은 말 그대로 원하는 위치의 인.. 2022. 7. 27.
PHILINNOVATOR | 포스트 인지혁명, 인간은 ‘신’을 꿈꾸는가 나 그리고 당신을 위한 ‘초연결 시대 현자 되기’ 프로젝트! 21세기 혼란스러운 초연결 사회에서 중심을 잡고 지혜롭게 살아가기 위한 내용들을 담아 돌아온 ‘필리노베이터’입니다. 이번 달에는 지난 ‘2차 인지혁명, 인간을 넘어선 기계 2편’에 이은 ‘포스트 인지혁명, 인간은 신을 꿈꾸는가?’로 이어가 보겠습니다. 특별하지 않던 동물, 승리의 비결 인간 종이 처음 지구에 나타났을 때는 다른 동물들과 다를 바 없는 ‘특별하지 않은 동물’이었습니다. 특별할 게 없었던 동물 인간 종은 진화를 거듭하면서 유럽에서는 네안데르탈인이, 아프리카에선 현생 인류인 사피엔스가 나타나 살았고, 다른 인간 종들도 지구 전역에서 발생하여 살고 있었습니다. 그러다 어떤 계기로 인해 사피엔스는 아프리카에서 출발해서 유럽과 유라시아 지.. 2022. 7. 27.
Chapter 2. Numpy 1편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 Time Series 머신러닝을 위한 Python 필수 라이브러리, Numpy 1편 머신러닝 알고리즘을 공부하기 앞서, 시계열 데이터를 다루기 위해서 Python 언어의 라이브러리 사용법에 익숙해져야 할 필요가 있다. 이번 챕터에서는 라이브러리를 중점적으로 살펴보며, 여러 실습 예제를 다뤄볼 것이다. Numpy와 Pandas는 큰 규모의 데이터를 탄력적으로 작업할 수 있도록 많은 고성능 도구들을 제공한다. Numpy와 Pandas가 무엇인지 살펴보고, 그 핵심 기능들에 대해 알아보자. 실습을 위한 환경으로는 크게 Jupyter notebook을 직접 구축하여 로컬에서 사용하는 방법과 Google Colab을 사용하는 방법이 있다. 빠른 실습 환경 구축을 위해 Colab을 활용하기를 권장한다. * Nump.. 2022. 7. 27.