├── .DS_Store ├── README.md ├── blogs_road_of_ds.md ├── books_road_of_ds.md ├── curriculum_road_of_ds.md ├── etc_road_of_ds.md └── webs_road_of_ds.md /.DS_Store: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/hero4earth/road_of_DS/ba95213e9773932b236d6418647d91ece6a716cb/.DS_Store -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # Road of Data Scientist 2 | > 아직 완성되지 않았으며 계속해서 업데이트 중입니다. 3 | - - - 4 | 5 | ## 데이터 사이언티스트가 되는 길 6 | - 데이터 사이언티스트가 되기 위한 자료를 모아놓은 저장소 7 | 8 | #### 1. 커리큘럼(Curriculum) 9 | > 난이도 별로 강의와 학습자료 등을 정리하였습니다. 아직 미완성이며 소요 기간에 대해서 추후 학습 후 업데이트를 할 예정입니다. 10 | 11 | - [Curriculum](/curriculum_road_of_ds.md) 12 | 13 | #### 2. 학습 자료 분류 14 | 15 | - [Books](/books_road_of_ds.md) 16 | 17 | - [Web Sites](/webs_road_of_ds.md) 18 | 19 | - [Blogs](/blogs_road_of_ds.md) 20 | 21 | - [Etc.](/etc_raod_of_ds.md) 22 | -------------------------------------------------------------------------------- /blogs_road_of_ds.md: -------------------------------------------------------------------------------- 1 | # 데이터 사이언스 블로그(Data Science Blogs) 2 | ## Road of Data Scientist 3 | > Ver. 10 Feb, 2018 4 | 5 | - - - 6 | 7 | ## 데이터 사이언티스트를 위한 블로그 모음 8 | -------------------------------------------------------------------------------- /books_road_of_ds.md: -------------------------------------------------------------------------------- 1 | # 데이터 사이언스 책(Data Science Books) 2 | ## Road of Data Scientist 3 | > Ver. 10 Feb, 2018 4 | 5 | - - - 6 | 7 | ## 데이터 사이언티스트를 위한 책 모음 8 | > 책과 교재를 포함한 추천 도서입니다. 9 | 10 | ### 1. 데이터 분석 / 빅데이터 11 | * [x] 세상에서 가장 쉬운 통계학 입문 / 고지마 히로유키 12 | - 통계학에 대한 개념을 잡기에 유용한 책으로 쉽게 설명되어 있다. 강추 13 | * [x] 세상에서 가장 쉬운 베이즈 통계학 입문 / 고지마 히로유키 14 | - 데이터 사이언스를 배우다 보면 '베이지안 이론'에 대해서 이해가 필요한데 이 책을 통해 쉽게 개념을 잡을 수 있음 15 | * [x] 헬로우 데이터과학 / 김진영 (동대문정보화) 16 | - 데이터 과학(사이언스)가 무엇인지 전체적으로 실무자 입장에서 잘 설명해주고 있는 책으로 관심을 가지고 있는 입문자에게 추천하는 책. 17 | - 개인적으로 Quantified Self라는 세상을 알게한 책 18 | * [x] 데이터 과학 : 어떻게 기업을 바꾸었나? : 누구도 말해 주지 않았던 데이터 과학자의 실무 / 김옥기 19 | * [x] 빅 데이터가 만드는 세상 / 빅토르 마이어 쇤버거 / 21세기북스 20 | - 책이 나온지 오래 되었지만 데이터가 만들 미래에 대해 이해하고 시야를 넓히는데 도움이 많이 된 책 21 | * [ ] 앞으로 데이터 분석을 시작하려는 사람을 위한 책 / 구도 다쿠야 / 루비페이퍼 22 | * [ ] 신호와 소음 : 미래는 어떻게 당신 손에 잡히는가 / 네이트 실버 / 더퀘스트 23 | * [ ] 하둡 인 프랙티스 24 | * [x] 데이터 과학 입문(Doing Data Science) 25 | - 아직은 이해하기 어려운 책... 나중에 다시 읽어야할 책! 26 | * [x] 빅데이터를 지배하는 통계의 힘 / 니시우치 히로무 27 | - 통계의 중요성과 통계적 관점을 가질 수 있도록 돕는 책 28 | * [ ] 헤드 퍼스트 데이터 분석 29 | * [ ] [Probabilistic Programming & Bayesian Methods for Hackers](http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/#prologue) 30 | * [x] [R을 이용한 데이터 처리 & 분석 실무](http://r4pda.co.kr/) 31 | 32 | ### 2. 프로그래밍 33 | * [ ] [읽기 좋은 코드가 좋은 코드다](http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9788979149142&orderClick=LEA&Kc=) 34 | * [ ] 마스터 알고리즘 35 | * [ ] 코딩 더 매트릭스 / 필립 클라인 저 / 마이클 역 | 루비페이퍼 36 | * [ ] 집단 지성 프로그래밍 37 | 38 | 39 | ### 3 머신러닝 / 인공지능 40 | - [Generalized Linear models with random effect](http://www.kyobobook.co.kr/product/detailViewEng.laf?mallGb=ENG&ejkGb=BNT&orderClick=LEC&barcode=9781498720618) 41 | - [Convex optimized theory](http://www.athenasc.com/convexduality.html) 42 | - [pattern recognition and machine learning / Christopher M. Bishop](http://www.kyobobook.co.kr/product/detailViewEng.laf?ejkGb=ENG&mallGb=ENG&barcode=9780387310732&orderClick=LAI&Kc=) 43 | - [ ] 해커 스타일로 배우는 기계학습 44 | -------------------------------------------------------------------------------- /curriculum_road_of_ds.md: -------------------------------------------------------------------------------- 1 | # 데이터 사이언스 커리큘럼(Data Science Curriculum) 2 | ## Road of Data Scientist 3 | > Ver. 10 Feb, 2018 4 | 5 | - - - 6 | 7 | ## 데이터 사이언스 커리큘럼 8 | > 제가 학습했거나 인터넷에서 추천한 강의를 모아서 난이도 별로 정리하였습니다. 계속해서 업데이트 중이며 고급 단게는 아직 접근하지 못한 영역이라 바라만 보고 있습니다. 9 | 10 | 11 | ### 1. 기초(Prerequisite) 12 | #### 1) 수학 13 | ##### 미적분 14 | 15 | - (Lecture/English) [Calculus One](https://www.coursera.org/learn/calculus1) from Coursera 16 | 17 | ##### 선형대수 18 | 19 | - (Lecture / English) [Linear Algebra](https://www.khanacademy.org/math/linear-algebra) from Khan Academy 20 | - 쉽고 친절한 설명으로 영어이지만 이해 쉬움 21 | - (Lecture / English) [Linear Algebra](https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/video-lectures/) from MIT 22 | 23 | #### 2) 통계 24 | ##### 확률과 통계 25 | 26 | - (Lecture / English) [Statistics and probability](https://www.khanacademy.org/math/statistics-probability) from Khan Academy 27 | 28 | - (Lecture / English) [Statistics One](https://www.youtube.com/watch?v=VJlpQs4a5LI&list=PLgIPpm6tJZoTlY4A-xikgjXmlscqduP5k) from Youtube 29 | 30 | - (Lecture / English) [Basic Statistics](https://www.coursera.org/learn/basic-statistics?recoOrder=31&utm_medium=email&utm_source=recommendations&utm_campaign=recommendationsEmail~recs_email_2016_10_23_17%3A58) from Coursera 31 | 32 | - (Lecture / English) [Inference Statistic](https://www.coursera.org/learn/statistical-inference) from Coursera 33 | 34 | - (Lecture / Korean) [경제통계학](http://www.kmooc.kr/courses/course-v1:SNUk+SNU212.204.1k+2017_T1/about) from K-MOOC 35 | - 서울대 류근관 교수님 강의로 시중에 판매되는 '통계학' 책도 있음 36 | - 핵심을 짚어 주셔서 큰 그림으로 잡고 공부하기에 유용함 37 | 38 | #### 3) 컴퓨터 기초 39 | ##### 프로그래밍(Python) 40 | - (Text Book / English) [Learn Python](https://www.codecademy.com/learn/learn-python) from CodeAcademy 41 | 42 | ##### 컴퓨터 과학 43 | - (Lecture / Korean Sub) [비전공자를 위한 컴퓨터과학 입문(Harvard CS50)](http://www.edwith.org/connect_cs) from edwith 44 | - 비전공자를 위한 기초중의 기초 강의! 컴퓨터를 조금 다룬 분에게는 쉬운 내용임. 45 | - 교수님의 설명방식이 굉장히 쉽고 즐거워서 문화충격을 받은 강의 46 | 47 | ### 2. 초급(Basic) 48 | #### 1) 프로그래밍(Python) 49 | - (Lecture / English) [Python for Everybody Specialization](https://www.coursera.org/specializations/python?recoOrder=0&utm_medium=email&utm_source=recommendations&utm_campaign=recommendationsEmail~recs_email_2016_10_23_17%3A58) from Coursera 50 | - 파이썬을 처음으로 공부하면서 시작한 강의로 교수님이 매우 유쾌하고 잘 가르쳐 주심, 강의 구성도 탄탄하여 시간을 들여 공부하면서 파이썬을 배울 수 있음 51 | - (Lecture / Korean) [데이터 과학을 위한 파이썬 입문 / 가천대학교 TEAMLAB](https://www.youtube.com/watch?list=PLBHVuYlKEkUJvRVv9_je9j3BpHwGHSZHz&v=EyAHKYqrEe8) from Youtube 52 | - 뒤늦게 알게 되어 들어 보지는 않았지만 주변에서 많은 분들이 추천한 강의 53 | - 한글 강의를 원하는 분들에게 추천 54 | 55 | #### 2) 데이터 분석 56 | - (Lecture / English) [Intro of Data Science](https://classroom.udacity.com/courses/ud359) from Udacity 57 | - 데이터 분석을 처음 접하는 사람에게 전체적인 흐름을 알려주는 강의 58 | - 강의 내용이 쉽고 이해하기 좋지만 디테일이 조금 부족한 감이 있어서 강의만 의존해서는 안됨 59 | 60 | #### 3) 머신러닝 및 인공지능 61 | - (Lecture / Korean) [머신러닝과 딥러닝](http://www.edwith.org/others26) from edwith 62 | - 김성훈 교수님(지금은 네이버에 계신)의 '모두를 위한 딥러닝 강좌를 네이버의 edwith에서 제공하고 있음(유튜브로도 볼 수 있음) 63 | - 정말 쉽고 친절하게 이해하기 쉽도록 알려주셔서 딥러닝을 처음 시작하는 분들에게 강추하는 강의 64 | - (Lecture / Korean) [강화학습](http://www.edwith.org/others27) from edwith 65 | - 김성훈 교수님의 '모두를 위한 딥러닝 강좌' 중 강화학습 부분 66 | - (Lecture / English) [Artificial Intelligence](https://classroom.udacity.com/courses/ud954) from Udacity 67 | - (Text Book / Korean) [밑바닥부터 시작하는 딥러닝](http://www.kyobobook.co.kr/product/detailViewKor.laf?barcode=9788968484636) 68 | - 딥러닝 라이브러리 없이 배열을 가지고 직접 신경망을 만들어보면서 딥러닝의 기초를 다질 수 있는 책 69 | - 쉽게 코드를 따라하면서 딥러닝 이론을 공부하기에 매우 유용한 책 70 | 71 | ### 3. 중급(Intermediate) 72 | > 현재 진행중인 단계 73 | 74 | #### 1) 프로그래밍(Python) 75 | - (Lecture / Korean) [데이터 구조 및 분석](http://www.edwith.org/datastructure-2017f) from edwith 76 | - 카이스트 문일철 교수님의 강의로 데이터 분석 관점에서 데이터 구조를 다루기 때문에 일반 자료구조 보다 쉽고 유익한 강의 77 | 78 | - (Lecture / English) [Data Structure](https://www.coursera.org/learn/data-structures?recoOrder=6&utm_medium=email&utm_source=recommendations&utm_campaign=recommendationsEmail~recs_email_2016_10_23_17%3A58) from Coursera 79 | 80 | #### 2) 데이터 분석 81 | - (Text Book / English) [Data Mining: Concept and Techniques](http://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdf) 82 | - 데이터 마이닝 전공책으로 데이터 마이닝 이론에 대해 상세하게 잘 설명되어 있으며 데이터 분석 단계별로 기초가 되는 알고리즘에 대해 깊이 있게 공부할 수 있음 83 | - (Text Book / English) [Python Data Science Handbook](https://jakevdp.github.io/PythonDataScienceHandbook/) 84 | - (Lecture / English) [CS109 Data Science from Harvard Univ.](http://cs109.github.io/2015/pages/videos.html) 85 | - (Lecture / English) [Learning from Data / Yaser Abu-Mostafa](https://work.caltech.edu/telecourse.html) from CalTech 86 | - (Lecture / English) [Executive Data Science Specialization](https://www.coursera.org/specializations/executive-data-science) from Coursera 87 | - (Lecture / English) [Data Science Specialization](https://www.coursera.org/specializations/jhu-data-science?recoOrder=15&utm_medium=email&utm_source=recommendations&utm_campaign=recommendationsEmail~recs_email_2016_10_23_17%3A58) from Coursera 88 | - (Lecture / English) [Data Visualization from Coursera](https://www.coursera.org/learn/datavisualization) from Coursera 89 | - (Lecture / English) [Data Management and Visualization](https://www.coursera.org/learn/data-visualization#syllabus) from Coursera 90 | - (Lecture / Korean) [허민석님 유튜브 자료](https://www.youtube.com/user/TheEasyoung/playlists) 91 | - (Lecture / Korean) [오늘의 코드](https://www.youtube.com/channel/UCLR3sD0KB_dWpvcsrLP0aUg) by [Joeun Park](https://github.com/corazzon) 92 | - 동영상을 접하고 감탄을 연발한 유튜브 영상으로 Kaggle 프로젝트를 아주 친절하고 상세하고 쉽게 설명하고 있음(감동의 눈물) 93 | #### 3) 인공지능 및 머신러닝 94 | - (Text Book / Korean) [패턴인식 / 오일석](http://www.kyobobook.co.kr/product/detailViewKor.laf?barcode=9788970859040) 95 | - 한글로 된 머신러닝/인공지능 책 중에서 추천을 많이 받은 교재로 머신러닝과 신경망의 기초가 되는 이론을 한글로 학습하기에 유용함 96 | - (Lecture / Korean) [인공지능 및 기계학습 개론 1](http://www.edwith.org/machinelearning1_17) from edwith 97 | - (Lecture / Korean) [인공지능 및 기계학습 개론 2](http://www.edwith.org/machinelearning2__17) from edwith 98 | - 카이스트 문일철 교수님의 강의로 1, 2로 나누어져 있으며 기본적인 머신러닝 알고리즘부터 신경망의 기초가 되는 알고리즘까지 기초를 익힐 수 있음 99 | - 수학이 많이 나오지는 않지만 확률과 통계, 미적분 등을 알아야 배울 수 있으며, 한번에 이해하기에는 난이도가 있는 강의 100 | - (Lecture / Korean) [인공지능과 기계학습](http://www.kmooc.kr/courses/course-v1:KAISTk+KCS470+2017_K0201/info) from K-MOOC 101 | - 카이스트 오헤연 교수님의 강의로 머신러닝과 신경망 알고리즘에 대해서 배울 수 있으며 수학적인 설명이 많지만 기초 수준의 강의이기 때문에 깊이 있는 부분이 나오면 이해하기 어려움 102 | - (lecture / Korean) [테리의 딥러닝 토크](https://www.youtube.com/user/TerryTaewoongUm/playlists) by Terry Um from Youtube 103 | - 현재 캐나다 워털루 대학원에서 박사과정이신 엄태웅님이 만드신 강의자료입니다! 104 | - 친근한 설명으로 더 쉽게 이해할 수 있습니다. 105 | - (Lecture / English) [Machine Learning](https://www.coursera.org/learn/machine-learning) by Andrew Ng from Coursera 106 | - 설명이 필요 없는 명강의 107 | 108 | #### 4) 빅데이터 & 데이터 마이닝 109 | ##### 분산처리 110 | - (Lecture / English) [Introduction to Big Data with Apache Spark](https://www.edx.org/course/big-data-analysis-apache-spark-uc-berkeleyx-cs110x) from edx 111 | - (Lecture / English) [introduction to Big Data](https://www.coursera.org/learn/big-data-introduction?recoOrder=24&utm_medium=email&utm_source=recommendations&utm_campaign=recommendationsEmail~recs_email_2016_10_23_17%3A58) from Coursera 112 | - (Lecture / English)[Big Data Specialization](https://www.coursera.org/specializations/big-data) from Coursera 113 | ##### SQL 114 | - 추천 받습니다! 115 | 116 | #### 5) 기타 117 | ##### GitHub 118 | - (Text Book / Korean) [Pro Git Book 공식 번역서](https://git-scm.com/book/ko/v2) 119 | 120 | ##### Linux 121 | - 추천 받습니다! 122 | 123 | ### 4. 고급(Advanced) 124 | #### 1) 데이터 분석 125 | - [Kaggle](https://www.kaggle.com/) 126 | - 고급이라고 생각되는 단게에서 데이터 분석은 계속해서 프로젝트를 해보는 것이므로 Kaggle에 올라오는 대회에 참여하여 실력을 향상하는 것이 가장 좋은 방법이라고 생각됨 127 | 128 | #### 2) 인공지능 및 머신러닝 129 | - 논문 재현 130 | - 논문을 읽고 이해하고 재현할 수 있는 정도의 실력이라면 고급 수준의 학습 방법으로 생각됨 131 | 132 | - (Lecture / English) [Probability Graphical Model by Daphne Koller](https://www.coursera.org/learn/probabilistic-graphical-models) 133 | - (Lecture / English) [Neural Network for machine learning by Jeoffrey Hinton](https://www.coursera.org/learn/neural-networks) 134 | - (Text Book / English) [CS231n Convolutional Neural Networks for Visual Recognition](http://cs231n.github.io/) from Stanford Univ. 135 | - (Text Book / English) [Deep Learning / Ian Goodfellow and Yoshua Bengio and Aaron Courville](http://www.deeplearningbook.org/) -> ([교보문고 링크](https://goo.gl/5CLvvo)) 136 | - (Text Book / English) [Machine Learning / Kevin Murphy](https://www.goodreads.com/book/show/15857489-machine-learning) 137 | 138 | --- 139 | 140 | ## References 141 | > 참고하거나 추천할 만한 링크 모음 142 | 143 | - [Hitchhiker's Guide to Data Science, Machine Learning, R, Python](http://www.datasciencecentral.com/profiles/blogs/hitchhiker-s-guide-to-data-science-machine-learning-r-python) 144 | - [An annotated path to start with Machine Learning](https://www.bonaccorso.eu/2017/09/09/an-annotated-path-to-start-with-machine-learning/) 145 | - [The Open Source Data Science Master](http://datasciencemasters.org/) 146 | - [Data Scientist in 8 easy steps](https://www.datacamp.com/community/tutorials/how-to-become-a-data-scientist) 147 | - [I Dropped Out of School to Create My Own Data Science Master’s — Here’s My Curriculum](https://medium.com/@davidventuri/i-dropped-out-of-school-to-create-my-own-data-science-master-s-here-s-my-curriculum-1b400dcee412) 148 | - [The Best Data Scientist Curriculum - Class Central Career Guides](https://www.class-central.com/report/best-data-science-curriculum/) 149 | - [머신러닝, 제대로 배우는 법](https://brunch.co.kr/@aidenswmo/2) 150 | - [데이터 분석가를 위한 개발 공부](http://www.boxnwhis.kr/2016/03/25/how_to_be_a_developer_as_a_statistician.html) 151 | - ['데이터 과학자 입문 도우미' 무료 온라인 서비스 라운드업](http://www.ciokorea.com/news/31066) 152 | - [어떻게 하면 데이터 사이언티스트가 될 수 있나요?](http://www.slideshare.net/yongho/how-to-bedatascientist) by 하용호 153 | -------------------------------------------------------------------------------- /etc_road_of_ds.md: -------------------------------------------------------------------------------- 1 | # 데이터 사이언스 기타 참고자료(Data Science Additional References) 2 | ## Road of Data Scientist 3 | > Ver. 10 Feb, 2018 4 | 5 | - - - 6 | -------------------------------------------------------------------------------- /webs_road_of_ds.md: -------------------------------------------------------------------------------- 1 | # 데이터 사이언스 웹사이트(Data Science Web Sites) 2 | ## Road of Data Scientist 3 | > Ver. 10 Feb, 2018 4 | 5 | - - - 6 | 7 | ## 데이터 사이언티스트를 위한 웹사이트 모음 8 | > 책과 교재를 포함한 추천 도서입니다. 9 | 10 | ###1. 학습 사이트(MOOC 포함) 11 | #### 국내 12 | - [edwith](http://www.edwith.org/) : 네이버 커넥트재단에서 만든 MOOC 서비스로 강의, 세미나는 물론 다른 대학과 제휴하여 좋은 강의를 제공하고 있습니다. 13 | - [K-MOOC](http://www.kmooc.kr/) : 정부에서 운영하는 MOOC 서비스입니다. 인문, 사회, 자연과학, 공학 등 모든 분야의 굉장히 많은 대학이 참여한 국내 최대 MOOC 서비스입니다. 14 | - [모두의 연구소](http://www.modulabs.co.kr/) : 누구나 모여서 함께 연구할 수 있다라는 비전으로 운영되고 있는 자율형사립연구소입니다. 다양한 기술의 이론부터 응용까지 깊이 있게 연구하고 공부하는 모임입니다. 15 | - [T-Academy](https://tacademy.sktechx.com/frontMain.action) - SK에서 운영하는 교육 플랫폼입니다. 잘 모르는시는 분이 많은데 정기적으로 오프라인 세미나도 열고 온라인 강의도 제공하고 있습니다. 16 | 17 | #### 해외 18 | 외국의 대표적인 MOOC 서비스입니다. 제가 좋아하는 순서로 모았습니다. Coursera가 가장 대표적이며 양질의 강의를 대부분 무료로 들을 수 있습니다. 그리고 Udacity의 경우 대학 강의가 아니라 실무에 계신 전문가가 직접 강의하여 Coursera보다는 쉽고 실질적인 강의입니다. 19 | - [Coursera](https://www.coursera.org) 20 | - [Udacity](https://www.udacity.com/) 21 | - [Khan Academy](https://www.khanacademy.org/) 22 | - [Edx](https://www.edx.org/) 23 | 24 | 25 | 26 | 27 | #### 기타 28 | - [Youtube](https://www.youtube.com/) 에서 검색 29 | 30 | ### 2. 국내 데이터 관련 사이트 31 | 32 | ### 3. 해외 데이터 관련 사이트 33 | * [Kaggle](https://www.kaggle.com/) : 데이터 분석 경진 대회를 제공하는 서비스입니다. 데이터 분석을 연습하거나 실제 기업의 문제를 풀어 상금까지 받을 수 있습니다. 34 | 35 | ### 4. 기타 유용한 사이트 36 | - [Academic Torrents](http://academictorrents.com/) : 학술적 연구 데이타셋 모아 놓은 곳 37 | --------------------------------------------------------------------------------