homework


  • due date: 2021-12-31 23:59 제출
    • pdf 또는 png 형식으로 제출할 것
    • 태블릿 또는 스캔본으로 제출할 것

P1.

이전 HW 2, 3, 4 중에서 완료 하지 못 했던 숙제 하나에 대한 라이프를 제공합니다. HW5 마감일인 2021-12-31 자정까지 제출한다면 해당 HW를 제출한 것으로 인정하겠습니다.

HW4까지 모두 제출하신 분은 추가로 제출하실 필요는 없습니다 👏

P2. NLP를 위한 준비

다음 세미나부터 진행하는 NLP(자연어 처리) 챕터를 위해 미리 필요한 지식을 습득해봅시다.

“딥러닝을 이용한 자연어 처리 입문” 중 “텍스트 전처리” 파트의 8개 아티클을 읽고 핵심 개념들 추려 요약해봅시다.

  1. 토큰화(Tokenization)
  2. 정제(Cleaniing)와 정규화(Normalization)
  3. 어간 추출(Stemming)과 표제어 추출(Lemmatization)
  4. 불용어(Stopword)
  5. 정규 표현식(Regular Expression)
  6. 정수 인코딩(Integer Encoding)
  7. 패딩(Padding)
  8. 원-핫 인코딩(One-Hot Encoding)