기간


담당 역할 및 프로젝트 기여도


주요기술


요약


  1. 데이터 전처리

    1. 컬럼 내 모든 데이터가 결측치인 경우 해당 컬럼 삭제
    2. train data의 통계정보를 바탕으로 test data 보간
    3. train data의 분포가 imbalanced 하여 세가지 데이터셋을 준비
      1. 전체 데이터를 증강한 데이터셋
      2. 적은 데이터만 선택적으로 증강한 데이터셋
      3. 가장 많은 데이터의 수를 줄여 분포를 균일하게 한 데이터셋
  2. 모델링

성과


프로젝트 내용