데이터베이스
Jupyter notebook, Pandas, Python
화이트해커 Luna 🌙
2023. 3. 15. 15:57
728x90
반응형
0. 개념정리
# IDLE(편집기)
- Visual Studio Code
- PyCharm
- Anaconda 데이터분석 최적화(같이깔리는 주피터)
- NotePad++
# 필수 라이브러리
- 판다스 : 데이터를 2차원목록으로 만들어 손쉽게 데이터분석 환경제공
- 맷플롯립 : 그림
# 판다스 자료구조
Pandas Series : 1차원 목록(사전)
DataFrame : 2차원 목록(사정)
# 실제 데이터분석
- 데이터 수집 (80%)
- csv
- excel
- DataBase
- 웹 크롤링(스크래핑) - 데이터 준비(랭글링) (수집/가공 80%)
- 데이터 탐색(수집한 자료 필드,컬럼 등 모양 확인)
- 데이터 정제(잘못된자료, 오염 등)
- 데이터 강화
- 데이터 유효성 검사
- 데이터 출판(제공) - 데이터 분석 두가지방법
- 탐색적 데이터 분석(대부분 이거)
- 확증적 데이터 분석
1. 설치
pip install jupyter notebook pandas numpy matplotlib seaborn requests
2. 실행
D:\Source>jupyter notebook
3. 사용법
표 만들기
수정 (copy)
지우기
여러개 지우기
728x90
반응형