파이썬으로 numpy, pandas도 활용해봤고 기본적인 머신러닝과 통계 개념 정도만 알면 괜찮지 않을까라는 안일하게 고르게 된 책입니다. 죄송하게도 통계에 대한 지식이 부족하여 수식을 제대로 이해하지 못하고 넘어가는 경우가 많았습니다. 너무 표면적인 부분만을 이해한 것 같지만 제가 읽으며 배우거나 느낀 내용을 적어봅니다. 통계에서 배운 내용을 복습하며서 읽었는데 초반부터 저에게 생소한 용어가 등장해서 더 어려웠던 것 같습니다.
처치: 구하려는 효과에 대한 개입
내생 변수: 관측되지 않은(=시스템에 포함되지 않는) 요인에 의해 영향을 받는 변수
외생 변수: 모델링하지 않은 변수; 시스템 밖에서 주어지는 변수
...
그래도 여러 흥미로운 실제 사례, 연구, 그래프로 시각화하는 내용 등을 따라가며 인과추론을 할 때 어떤 것이 필요한지 엿볼 수 있었습니다. 실제 실무에서는 이런 것을 고려하고 어떤 어려움이 있는지 알 수 있었습니다. 저자는 다른 분야에서 쓰는 용어랑 뜻을 다르게 쓰기 때문에 흠.. GPT 쓸 때도 조심해야합니다. 머신러닝, 통계학, 계량경제학에서는 다른 뜻으로 용어를 쓰는 경우가 종종 있었습니다. 다른 분야에 대한 경험이 있다면, 이러한 점을 짚어주는 번역자의 주석이 많은 도움이 될 것 같습니다. M1 맥에서 실습하기에는 lightgbm, fklearn 등의 패키지를 설치하려면 시행착오를 겪거나 때로는 돌려보길 포기하기도 했습니다. 그렇지만 실행된 노트북이 제공되기도 하고 파이썬은 책의 내용을 도와주는 정도로 쓰이기 때문에 큰 문제는 없습니다. 데이터 분석에 관심이 있거나 관련 분야에 지식이 있는 분들께 추천드립니다.
기초적인 데이터 분석을 해본 경험이 있어서 괜찮을 줄 알았으나 제 전문성이 부족하여 제대로 된 서평을 남기지 못해 죄송합니다. 다음에는 제대로 책의 서두를 좀 더 꼼꼼하게 살펴보고 서평 도서로 지원하도록 하겠습니다.