티스토리 뷰

Language/Python

pandas 실전 데이터 분석

KyeongRok Kim 2020. 4. 20. 05:22

강의 두줄 요약
- 판다스를 이용해 실전에서 많이 나오는 데이터 처리 패턴을 배워 보고 처리한 데이터를 분석 해봅니다.

 

Section0.개발 환경 설정
python3, pycharm설치하기, git설치하기
- project 생성하기
- hello출력하기

- pycharm 글자 크기 수정하기
- pycharm으로 git clone하기
- pycharm사용 방법

Section1.데이터 불러오기
CSV파일을 pd.DataFrame()으로 불러오기
- Pycharm에서 pandas설치
- 제대로 불러왔는지 확인하기(개수 세기)
- .head(5)로 데이터의 형태 확인 하기

두가지 데이터 합치기 .merge()
- 조건 두가지로 필터링 할 때 각각의 조건이 다른 데이터에 있는 경우
- key란?
- 데이터 합치고 필터링 하기

불러온 데이터를 다른 형식으로 저장하기
- df to CSV
- df to JSON
- df to Excel


- 구분자가 ,가 아닌 데이터에서 데이터 불러오기
json에서 데이터 불러오기
excel의 특정 sheet에서 데이터 불러오기

Lambda
- Lambda란?
- Lambda사용 방법
- .apply()로 식 적용하기

 

https://www.youtube.com/watch?v=MxZbGbLLB3I

30분
- filtering하기
- 새 df만들기
- 엑셀로 뽑기

https://www.youtube.com/watch?v=UOSFoy57DSU
판다스(pandas)로 데이터 조합하고 필요한 필드(열)만 뽑기
- txt에서 df로 데이터 불러오기
- csv에서 df로 데이터 불러오기
- merge로 합치기
- 필요한 필드만 뽑기 join
- 데이터베이스 excel vlookup

30분
위에꺼 참고

 

https://www.youtube.com/watch?v=RI03VA-mitQ

 

728x90
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/10   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함