무엇을 배웠는가?
현우님이 3.3장 까지의 요약을 준비해 주셨습니다.
엑셀 통합 문서를 Python을 사용하여 처리하는 방법
1.xlrd, xlwt 패키지 활용 2.팬더스 활용
단일 워크시트 처리
- 1.엑셀 파일 읽기 및 쓰기
- xlwt의 add_sheet(), wirte(), xlrd의 open_workbook() 활용
- 2.날짜 형식 할당
- datetime 모듈의 date(), xlrd의 xldate_as_tuple() 활용
- 3.팬더스
- read_excel(), ExcelWriter() 활용하자!
- 4.특정 행 필터링하기
- (팬더스를 활용하여) 데이터프레임의 이름 뒤에 대괄호 ( [ ] ) 를 쓰고 열의 이름, 특정 조건을 지정하면 쉽게 필터링이 가능하다!
- 5.특정 집합의 값을 포함하는 행의 필터링
- 팬더스의 isin()함수 활용해보기!
- 6.패턴을 활용한 필터링
- re 모듈의 compile()를 사용하여 regular expression 을 활용한다.
아래는 참고.
python regular expression에 대한 공식 문서
- 7.특정 열을 선택하기
- 팬더스의 iloc() 활용하면 좋고 편하다~ 혹은 열 헤더를 사용할 경우 loc()를 활용해 볼 것.
통합 문서의 모든 워크시트 읽기
팬더스의 read_excel()에서 sheetname = None 으로 지정해주면 한 번에 엑셀 통합 문서의 모든 워크시트를 읽는 것이 가능하다.
엑셀 통합 문서에서 워크시트 집합 읽기
엑셀 통합 문서에서 워크시트의 일부분만 처리해야 될 필요가 있기 때문에, sheet_by_index(), sheet_by_name()을 활용한다. 팬더스의 read_excel()에서 워크시트의 index 번호나 이름을 지정해주면 특정 워크시트를 쉽게 선택하는 것이 가능해진다!
심화 과정에서 무엇을 배웠는가?
호성님께서 pseudo code를 작성해나가는 과정을 보여주시면서, 코드를 어떻게 논리적으로 설계해나가야되는지에 대해 짚어주셨습니다. 논리적 설계 이후, 실제 코드로 작성해보는 연습의 시간이 매우매우 중요하다는 것을 느낄 수 있었습니다.
어땠는가?
8퍼센트의 프로덕트팀 인턴으로 입사해서 Python에 발을 담군지 이제 겨우 2주 밖에 되지 않았지만, 그 효율성과 간편함을 거울아^2 세미나를 하면서 종종 느끼고 있다. 예전에 c++로 Excel파일과 csv 파일을 다룬적이 있었는데, 상당히 애를 먹었던 것으로 기억한다. 하지만 이번에 새로배운 Python 코드를 읽을때는, 확실히 전에 비해서 엄청 편리하다는 것을 느끼고, 너무 편리해서 아직 코드를 잘 작성하거나, 그 활용 방법을 익힐 때 어색함과 어려움을 종종 느끼고 있다. ( 엄청 좋고 새로운 디바이스를 처음 만진 기분이다. 2주가 되었지만..)
데이터 분석 세미나의 책 과정에 대한 솔직한 느낌을 표현하면, 아직 유용함을 잘 느끼지는 못하겠다. 물론 종종 같은 프로덕트팀의 규승님께서 팬더스를 활용해서 데이터의 기록을 추적하는 모습을 옆에서 힐끗힐끗 보면서, 신기하다는 생각은 가졌지만, 근본적으로 얼마나 이 공부과정이 유용하게 다가올지는 잘 모르겠다.
아직 공부를 덜 했고, 초반이라서 그런것 같다. 예전에 대학교 지도교수님께서 한 영역 제대로 다 배워보기도 전에 섣불리 판단하는 것은 위험하다고 조언해주셨는데, 이번에도 같은 실수를 속으로 조금씩 범하고 있는 것 같다.
좀 더 집중력있고 끈기 있게 공부해야 겠다. 분명히 더 많이 배우고 익히다 보면 자연스럽게 그 중요성을 몸소 느낄 수 있는 시간이 분명히 올 것이라고 생각이 든다.
+
피자가 너무 맛있었지만, 회사에서 이렇게 스터디를 하면서 다같이 밤 늦은시간까지 모여있다는 것이 신기하고 어색하게 느껴져서 피자를 많이 못먹었다. 다음에는 많이 먹어야겠다. ㅎㅎ