티스토리 뷰

데이터 시각화를 공부하고 관련 작업을 계속해서 하려는 사람으로서 통계 공부의 필요성을 절감하고 있었다. 매번 깔짝 거리다 포기했던 통계 공부. 비전공자로서 통계를 배워서 프로젝트에 사용하거나 개인적 궁금함을 해결하고 싶은 분들을 위해 내가 겪었던 통계 공부의 어려움을 공유하고 책도 한권 추천하고자 한다.




통계 공부를 하려는 이유?

타당한 근거를 들어서 내 목소리를 내고 싶어서



회사에서나 프리랜서로서 진행해온 프로젝트에서는 이미 다른 사람에 의해 몇 차례 분석이 된 데이터를 시각화만 하는 경우가 많았다. 통계 분석, 신뢰도 등에 대해서 고민하기 보다는 디자이너로서 '직관적인 시각화'에 대해서 고민하기에도 빡빡한 일정이었다.


그러나 회사를 나와서 내가 자발적으로 프로젝트 주제를 선정하고, 데이터나 논문을 직접 찾아 보다보니 내가 통계적 추론에 대한 지식이 아예 없다는 것을 깨닫게 되었다. 개발자가 R로 산포도와 회귀선을 그려서 줘도 그것을 보고 어떤 의미가 있고 어떤 가설을 세우고 검증 해볼 수 있을 지 전혀 감이 오지 않았던 것이다. 직관적인 시각화에 앞서서 전달하려는 메시지를 일단 분명히 해야하는데 그게 불가능하니까 최종 구현 단계인 시각화가 아예 불가능했다.



내가 느끼는 문제를 해결하고, 정확한 정보나 사실관계를 파악 하려고 데이터나 논문을 찾아보지만 데이터에서 어떤 의미도 이끌어 내지 못하고, 논문에서 시행한 설문조사나 통계에 대해 신뢰할 수 있는 지 판단할 수 없다는 것은, 내가 내 목소리를 낼 근거를 마련하지 못한다는 것이었다. 입으로 내는 말과 달리, 글을 쓰면 스스로 논리적 오류를 더 잘 인식하게 되듯, 데이터를 시각화 하려는 일련의 과정들을 거치다보면 더더욱 철저하게 논리와 인과 관계를 따질 수 밖에 없게 된다.


내가 만든 콘텐츠에 책임을 지고 싶고, 설령 고민 끝에 내린 답이 틀렸다 할지라도 어디서부터 틀렸는지 알고 싶다는 생각에 통계 공부의 필요성을 절감하였다.







통계 공부 시행착오

데이터를 검증하기 위해서는 얼마나 깊이 공부해야 하나



이러한 필요성 때문에 지지난달 통계 공부를 시작해보았다. 큰 돈과 시간을 들이고 싶진 않았고 일단 기초 지식을 넓게 배우고 싶었기 때문에 LX대한지적공사에서 회원가입 필요 없이 무료로 제공해주는 동영상 강의(링크)를 보고 연습문제를 받아 공부하였다. (통계 바보를 위한 내용인 줄 알았지만, 건너뛰는 내용이 굉장히 많기 때문에 기본 지식이 없는, 통계 바보보다 심한 저같은 통알못 분들에겐 추천드리지 않습니다. ㅠㅠ)


어서 와, 통계는 처음이지? ^^



산술기하평균을 구하고, 검정, 노랑, 파랑 공이 3개씩 들어있는 주머니에서 두번 연속 파란색 공을 뽑을 확률을 구하는 동안 고등학교 때 이과를 다니기를 잘했다는 뿌듯함이 드는 것은 잠시 뿐이었다. 공부를 하면 할 수록, "그래서 데이터를 볼 때 이걸 어떻게 써먹어야 하는건데?", "이게 왜 필요한데?" 라는 의문이 계속 들었다. 그리고 그런 의문을 해소하기 위해 찾아본 다른 통계 강의 커리큘럼은 전공자가 아닌 나에게는 너무 심도있고 이론 중심적이었다. 또한 데이터 분석에 적용가능한 수준에 도달하기 위해서는 확률과 통계에 대한 기본 지식을 차곡차곡 쌓아야만 했다.







평균 구하기, 그래프 그리기, 분산 및 표준편차 구하기?

: 그런 건 R이 다 해주잖아



그래도 고행 끝에 낙이 올거라 믿으며 연습 문제를 열심히 풀며 졸며 하고 있을 때, 옆에 앉아 작업하던 (타칭)개발자분이 던진 한마디에 삽질을 관두게 되었다.


"그렇게 평균 구하고 분포 그리고 회귀선 그리는 것은 R에서 다 할 수 있잖아."


"맞다. 그렇지. 컴퓨터가 괜히 있는 게 아니고 사람들이 R을 괜히 쓰는 게 아니지."

관성으로 주먹구구로 눈 가리고 하고 있던 통계 공부를 그만 두었다. 그러나 변하지 않는 사실은 내가 데이터를 분석한 것을 보고 비판적인 관점을 가질 능력이 없다는 것이었다. 그러나 통계 학자가 되기 보다는, 실제 내 프로젝트에서 적용이 가능한 만큼 공부하고 싶은 나는 뭘 어디서 어떻게 공부해야할 지 알 수 없었다.




사람마다 다른, 통계 공부의 목적.

그 필요 만큼이나 다양한 서적들



또 2개월 정도 통계 공부를 손놓고 있다가, 내가 진행 중인 프로젝트에서 데이터, 설문조사에 대한 신뢰도를 검증하고 싶다는 생각이 또 들게 되었다. 아.. 무한루프.... ! 그러던 와중에 통계와 데이터 시각화 관련한 스터디에 참여하게 되었고, 스터디를 위한 통계 교과서 선정을 위해 서점에 가서 함께 스터디를 참여 중인 개발자 분과 함께 이책 저책을 살펴보았다. 이론만 공부하다 지쳤던 만큼 통계 스터디를 위한 책을 고를 때 최우선 적으로 다음 두 가지를 기준으로 삼았다.


첫째, 실용적일 것 (비전공자가 실용적으로 통계 지식을 활용할 수 있게할 것)

둘째, 이론뿐이 아닌 사례가 함께 나올 것 (이해하기 쉽도록)



서점에서 책들을 훑어보니 사람마다 통계를 공부하는 목적이 다른 만큼, 시중에 나와있는 책들도 다양한 접근법으로 통계에 대해 다루고 있었다. 나의 관점에서는 그 책들을 네 가지 정도로 분류할 수 있었다.


1. 통계학도를 위한 통계 책

2. 비즈니스용으로 고객 분석, A/B 테스트 등이 필요한 회사원을 위한 통계 책

3. 데이터 분석을 잘 활용한 사례를 보여주거나 왜곡된 통계를 잡아낼 수 있는 안목을 심어주는 책

4. 데이터를 가지고 유효한 메시지를 추출하거나 예측을 하고 싶은 사람을 위해 방법을 알려주는 책 



나의 니즈에는 네 번째 책의 형태가 적합했다. 그리고 그런 종류의 책들의 대표주자 격인 <Head First Data Analysis>라는 책을 교과서로 삼게 되었다.







친절한 개인 과외선생님같은,

<Head First Data Analysis>, O'REILLY



나는 이번에 처음 알았지만 이미 Head First 시리즈는 아는 사람 사이에서는 입소문이 나있는 시리즈였다. 처음에는 조악한 편집 디자인으로 인해 굉장히 옛날에 나온 책인 줄 알았지만 그것들은 컨셉이고 이 책의 초판 년도는 비교적 최근이라 볼 수 있는 2013년..!! 처음엔 "이게 뭐야 ㅋㅋㅋ"하면서 봤지만 볼수록 빠져드는 마성의 책이다.


강의나 일반 통계 책이 일방향으로 지식을 전달하는 대학 강의를 진행하는 교수님 같다면, 이 책은 나의 귀찮은 질문들에 친절하게 일일이 답해주는 개인 과외 선생님 같다. 진정 사용자 중심적이고 인터랙티브한 콘텐츠다 ^^... 이 책은 총 13장으로 구성되어있는데, 매 챕터 마다 구체적인 문제 상황을 던져주며 나에게 해결해달라고 요청한다. 그리고 그 해결 과정을 단계 단계 잘 밟아 나갈 수 있도록 연습 문제나 헷갈릴 수 있는 부분에 대한 질의응답을 제시하고 있다.  



headfirst_data_analysis_img01


어머낫.. 이런 폭풍 칭찬이라니 하라는대로 했을 뿐인데^3^




누군가가 "와... 이 문제 진짜 어렵다.... 아무리 해도 안돼. 도와줄래? 너가 잘 할 것 같아서"라고 하면 없던 힘도 생겨나고 머리를 최대한 쥐어짜내서 최선을 다해 그 문제를 풀어보고자 하는 마음이 들지 않는가... 그리고 그 문제를 풀고 나서 "대박. 어떻게 이걸 풀었어? 진짜 잘하네. 너 없으면 이 문제 못풀었을거야.. 진짜 넌 대단한 것 같아."라는 피드백을 들으면 엄청나게 자존감이 상승하지 않는가.. 이 책은 이런 원초적인 본능을 자극하고 쾌감을 주는 방식으로 구성이 되어있다.


headfirst_data_analysis_img02



또한 이 책의 가장 좋은 부분 중 하나는 바보같은 질문은 없습니란 코너이다.

문제 해결 과정 중 생길 수 있는 질문들을 답해주고 있다. 생겨나는 질문들에 대해 따로 추가적인 지식을 찾느라 시간을 더 쓰지 않아도 되기 때문에, 그리고 이런 질문들이 생겨나는 게 이상한 게 아니라는 위안을 준다.






정리하며


다음 주부터 이 책에 대한 스터디가 시작된다. 책을 공부하는 중에 이 포스팅에 추가할 내용이 생긴다거나 이 책에 대한 나의 호평이 완전히 잘못 판단한 것이라는 생각이 들면 추가하겠다. 하지만 교보문고 책 리뷰를 보니 책에 대해 실망할 것 같진 않다 :) 통계에 입문하려는 비전공자에게 도움이 된다면 좋겠다. 해당 책의 교보문고 링크를 추가하며 글을 마친다.  -> 책 보러가기 (링크)







댓글