728x90
반응형
0. 개념정리
# IDLE(편집기)
- Visual Studio Code
- PyCharm
- Anaconda 데이터분석 최적화(같이깔리는 주피터)
- NotePad++
# 필수 라이브러리
- 판다스 : 데이터를 2차원목록으로 만들어 손쉽게 데이터분석 환경제공
- 맷플롯립 : 그림
# 판다스 자료구조
Pandas Series : 1차원 목록(사전)
DataFrame : 2차원 목록(사정)
# 실제 데이터분석
- 데이터 수집 (80%)
- csv
- excel
- DataBase
- 웹 크롤링(스크래핑) - 데이터 준비(랭글링) (수집/가공 80%)
- 데이터 탐색(수집한 자료 필드,컬럼 등 모양 확인)
- 데이터 정제(잘못된자료, 오염 등)
- 데이터 강화
- 데이터 유효성 검사
- 데이터 출판(제공) - 데이터 분석 두가지방법
- 탐색적 데이터 분석(대부분 이거)
- 확증적 데이터 분석
1. 설치
pip install jupyter notebook pandas numpy matplotlib seaborn requests
2. 실행
D:\Source>jupyter notebook

3. 사용법
표 만들기

수정 (copy)


지우기

여러개 지우기

728x90
반응형
'데이터베이스' 카테고리의 다른 글
[ORACLE] ORA-00942: table or view does not exist 에러 원인, 해결법 (1) | 2022.12.02 |
---|---|
[ORACLE] MOUNT 상태에서 data file 이동하기 (0) | 2022.11.18 |
[ORACLE] Redo log 파일 미러링하기 (0) | 2022.11.18 |
[ORACLE] control file 다중화하기 (0) | 2022.11.18 |