Welcome to Data Mining class of 2015! Here you'll find all course materials, guides and schedules. For discussions, please visit the class e-class.

데이터마이닝(data mining)이란 대용량 데이터베이스에 존재하는 데이터에서 관계, 패턴, 규칙 등을 찾아내고 모형화해서 의사결정을 돕는 유용한 정보로 변환하는 일련의 과정이다. 본 강좌에서는 기술 모델링(descriptive modeling)과 예측 모델링(predictive modeling)에 사용되는 탐색적 통계, 기계학습, 범주형 자료분석 기법들을 공부하고 응용사례 연구와 패키지를 이용한 프로젝트를 수행한다.

Prerequisites

  • 한 가지 이상의 프로그래밍 언어에 대한 친숙함 (ex: R, Python, Java, etc.)

What you will learn

  • 데이터마이닝의 기본 개념, 구축 프로세스 학습 및 비즈니스 활용 사례 인식
  • 데이터마이닝의 주요 방법론의 이론적 토대 학습 및 응용 분야 학습
  • 데이터마이닝 분야에서 널리 사용되는 오픈소스 데이터 분석 언어인 파이썬 사용 방법 학습

Grading

  • Assignments (30%)
  • Final exam (30%)
  • Term Project (40%)

Schedule

For assignment guidelines, visit the class e-class.

datelecture
3/06Course introduction
  • Data mining
  • Assignment 0 (Due: 3/11) + Project proposal (Due: 3/18)
3/11Due date: Assignment 0
3/13지도학습 1: Multiple linear regression
3/18Due date: Project proposal, Fix project teams
3/20지도학습 2: Logistic regression
3/27지도학습 3: Decision tree + k-NN
  • In class project discussions
3/29Due date: Choose team project topic
4/02Due date: Assignment 1
4/03텍스트 마이닝 1: 이론
4/10텍스트 마이닝 2: 실습
4/17변수 선택과 차원 축소
4/24비지도학습 1: k-means + hierarchical clustering
5/01비지도학습 2: Market basket analysis
5/07Due date: Assignment 2
5/07Due date: Team project presentation slides
5/08Team project presentations
5/15지도학습 5: Artificial neural networks
  • Assignment 3 (Due: 6/4)
5/22지도학습 6: Support vector machines
5/29데이터 시각화
6/04Due date: Assignment 3
6/05대용량 데이터마이닝
6/12Final Exam
6/14Due date: Team project final report