데이터베이스

Jupyter notebook, Pandas, Python

화이트해커 Luna 🌙 2023. 3. 15. 15:57
728x90
반응형

0. 개념정리

 

# IDLE(편집기)

- Visual Studio Code
- PyCharm
- Anaconda 데이터분석 최적화(같이깔리는 주피터)
- NotePad++

 

 

# 필수 라이브러리

- 판다스 : 데이터를 2차원목록으로 만들어 손쉽게 데이터분석 환경제공
- 맷플롯립 : 그림

 

 

# 판다스 자료구조

Pandas Series : 1차원 목록(사전)
          DataFrame : 2차원 목록(사정)

 

 

# 실제 데이터분석
  1. 데이터 수집 (80%)
       - csv
       - excel
       - DataBase
       - 웹 크롤링(스크래핑)

  2. 데이터 준비(랭글링) (수집/가공 80%)
       - 데이터 탐색(수집한 자료 필드,컬럼 등 모양 확인)
       - 데이터 정제(잘못된자료, 오염 등)
       - 데이터 강화
       - 데이터 유효성 검사
       - 데이터 출판(제공)

  3. 데이터 분석 두가지방법
       - 탐색적 데이터 분석(대부분 이거)
       - 확증적 데이터 분석

1. 설치

 

pip install jupyter notebook pandas numpy matplotlib seaborn requests

 


 

2. 실행

 

D:\Source>jupyter notebook

 

 

 


 

3. 사용법

 

 

표 만들기

 

 

 

수정 (copy)

 

 

 

 

 

지우기

 

 

 

여러개 지우기

 

728x90
반응형