Welcome to Data Mining class of 2015! Here you'll find all course materials, guides and schedules. For discussions, please visit the class e-class.
데이터마이닝(data mining)이란 대용량 데이터베이스에 존재하는 데이터에서 관계, 패턴, 규칙 등을 찾아내고 모형화해서 의사결정을 돕는 유용한 정보로 변환하는 일련의 과정이다. 본 강좌에서는 기술 모델링(descriptive modeling)과 예측 모델링(predictive modeling)에 사용되는 탐색적 통계, 기계학습, 범주형 자료분석 기법들을 공부하고 응용사례 연구와 패키지를 이용한 프로젝트를 수행한다.
Prerequisites
- 한 가지 이상의 프로그래밍 언어에 대한 친숙함 (ex: R, Python, Java, etc.)
What you will learn
- 데이터마이닝의 기본 개념, 구축 프로세스 학습 및 비즈니스 활용 사례 인식
- 데이터마이닝의 주요 방법론의 이론적 토대 학습 및 응용 분야 학습
- 데이터마이닝 분야에서 널리 사용되는 오픈소스 데이터 분석 언어인 파이썬 사용 방법 학습
Grading
- Assignments (30%)
- Final exam (30%)
- Term Project (40%)
Schedule
For assignment guidelines, visit the class e-class.
date | lecture |
---|---|
3/06 | Course introduction
|
3/11 | Due date: Assignment 0 |
3/13 | 지도학습 1: Multiple linear regression |
3/18 | Due date: Project proposal, Fix project teams |
3/20 | 지도학습 2: Logistic regression |
3/27 | 지도학습 3: Decision tree + k-NN
|
3/29 | Due date: Choose team project topic |
4/02 | Due date: Assignment 1 |
4/03 | 텍스트 마이닝 1: 이론 |
4/10 | 텍스트 마이닝 2: 실습 |
4/17 | 변수 선택과 차원 축소 |
4/24 | 비지도학습 1: k-means + hierarchical clustering |
5/01 | 비지도학습 2: Market basket analysis |
5/07 | Due date: Assignment 2 |
5/07 | Due date: Team project presentation slides |
5/08 | Team project presentations |
5/15 | 지도학습 5: Artificial neural networks
|
5/22 | 지도학습 6: Support vector machines |
5/29 | 데이터 시각화 |
6/04 | Due date: Assignment 3 |
6/05 | 대용량 데이터마이닝 |
6/12 | Final Exam |
6/14 | Due date: Team project final report |