2023-2 유환조 교수님 데이터분석입문(데분입) 내용 정리

수업 무조건 들어야 함!! 시험에 다 나온다

개요: 데이터 분석 기법을 배우고, 기말고사 파트에서는 진짜 kaggle에서 데이터 분석 competition을 하는 식으로 진행된다.

시험 스타일: 필기 시험(화요일)+코딩 시험(목요일) 필기: 짜잘한 것을 많이 물어본다. 엄청난 계산이 필요한 문제가 많이 나오지 않는다 코딩: 중간고사 코딩의 경우 그때까지 나온 과제들과 거의 같은 문제들이 나온다. 기말고사 코딩의 경우 1시간동안 실시간 캐글 경쟁하는 식으로 진행된다.

<aside> 💡

캐글 꿀팁: 가장 기본 모형 하나, 가장 과적합된 모형 하나 2개 고르면 private public 둘다 높은 점수 받을 수 있다

이유: Public, Private 이 엄청나게 차이나는 경우 많음 → 보통 public에 과적합 되어서 그럼 따라서 점수 높은거 두개 내지 말고 차이나는거 두개 내면 좋음

</aside>

Pandas, Numpy Grammer

SQLite Grammer

matplotlib, seaborn Grammer


중간

Data Model

Relational Algebra

SQL

MapReduce

Exploratory Data Analysis (EDA)

Data Preprocessing

Statistics for Big data