Homework 6
homework
- due date: 2022-01-09 23:59 제출
- pdf 또는 png 형식으로 제출할 것
- 태블릿 또는 스캔본으로 제출할 것
P1. Gaussian Naive Bayes
seminar6에서는 자연어 데이터에서 NB Classifier를 구현했다. 그러나 NB Classifier를 자연어 데이터 뿐만 아니라 연속형(continuous) 데이터가 있는 Tabluar Dataset에서도 분류 모델로 사용할 수도 있다! 이런 Tabular Dataset에서는 Gaussian Naive Bayes Classifier를 모델로 사용할 수 있다.
내용이 그렇게 어렵지 않으니 아래의 아티클을 읽고 Gaussian NB를 직접 구현해보자!
[Python] Gaussian/Multinomial Naive Bayes Classification(가우시안/다항 나이브 베이즈 분류) 실습
아티클에는 Multi-nomoial의 경우도 나오는데 Gaussian NB만 구현해도 괜찮다.
- 제출은 colab 노트북 형태로 제출할 것
(optional) P2. Equivalence Gaussian NB and Logistic Regression
지금까지 배운(?) 분류 모델은 크게 Logistic Regression과 Naive Bayes Classifier가 있다. 놀라운 사실은 두 모델이 어떤 부분에서 동치라는 사실이다! ML에 관심이 많다면 재미있는 주제니 아래 아티클을 한번 읽어보길 바란다.
Equivalence of Gaussian Naive Bayes and Logistic Regression: An Explanation
- 참고로 본인이 대학원 수업 들을 때 기말고사에서 두 모델이 동치인 걸 증명하는 문제가 나왔었다 😢
- 요 문제도 제출을 원한다면 동치를 증명하는 일련의 과정을 적어서 제출할 것