거울아거울아 스터디 - 1
스터디에 앞서 모두들 1장을 공부해오기로 했다. 못 따라 오실 분들을 위해서 매주 화요일에 2시간씩 시간을 내었다. github 계정을 만들어 드리고 git 사용법을 알려 드리고, ipython notebook을 설치 해 드렸다. 너무 어려워 말고 조금은 장난감 같이 생각해 주셨으면 하는 바람이다. 어찌되었든 스터디는 시작되었다. 다들 화이팅!
여기까지는 호성이 씀. 이제 지윤님의 후기 시작.
요약 과정에서 무엇을 배웠는가?
안영님이 2.6장 까지의 요약을 준비해 주셨다.
특정 열 선택하기
특정 열 선택하는 방법은 2가지이다
열의 인덱스 값을 사용하는 방법
- 열의 인덱스 값을 쉽게 식별할 수 있을 때
- 여러개의 입력 파일을 처리할 때
- 모든 입력 파일에서 열의 위차가 변경되지 않을 때
열의 헤더를 사용하는 방법
- 열 헤더를 식별하기 쉬울 때
- 처리할 파일들의 열의 헤더는 같으나 열의 위치가 다를 때
심화 과정에서 무엇을 배웠는가?
ipython Notebook
- 결과 값을 바로 알 수 있도록 쓴다.
- python은 불편하지만 ipython Notebook은 결과 값 도출과 정보 저장이 쉽다.
- ipython Notebook은 결과값을 바로 알 수 있기 때문에 자주 실험을 해보는게 좋다.
ipython Notebook tour
- 사용법을 알기 위해 Help > User Interface Tour 을 통해 투어 해보는게 좋다.
ipython Notebook 실행 및 에러메세지 읽기
- Shift+Enter을 통해 결과 값을 바로 알 수 있다.
- Shift+Tab을 누르면 해당 함수의 인수를 어떻게 넣어야 하는지 알 수 있다.
- 파이썬 함수 적용법을 일단 써보고, 안되면 함수 설명을 참고한다(Shift+Tab)
- 안되면 영어로 구글링해서 파이썬 공식 문서를 참고한다.
팬더스
‘팬더스’는 ‘R’의 문법을 차용한 것으로 데이터 분석을 더 쉽게 도와주는 도구
팬더스로 데이터 선택하기
- .iloc : 정수 값(위치) 이용해 데이터를 선택할 수 있음
- .loc : label을 이용하여 데이터를 선택할 수 있다.
- .ix : 혼합된 위치 및 label 기반의 색인을 다룰 때 유용, 예외적 상황 아니라면 명시적으로 .loc 또는 .lioc 을 사용하는게 좋음
마지막으로 어땠는가?
- 결과값이 바로 나오는 ipython Notebook을 통해 자주 실험 해보는게 좋을 것 같다
- 기본파이썬 코드로 프로그래밍 개념과 문법을 통해 작업 수행하는 방법을 배우고 팬더스 코드로 신속하고 효율적으로 처리하는 방법을 배웠다.
- 분석해야되는 파일에 많은 열이 포함되어 있는 경우 필요한 열만 선택해볼 수 있겠다.