ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [기초프로젝트] Day2
    [스파르타코딩클럽]데이터분석 과정/TIL,WIL 2024. 1. 12. 21:37

    어제 데이터셋을 정했으니 오늘은 전처리를 시도하려고 했는데, 다시 보니 이 데이터로 진행하기 어려울 것 같아서 다시 데이터셋을 구했다.

     

    데이터수집을 끝내고, 데이터 전처리에 들어갔다.

    데이터셋에 다행히 null값이 없어 제거할 필요가 없었다.

    다만, 한 데이터에만 정보없음이 있어, 이 항목을 사용할지 안할지에 대해 고민을 해보았다.

     

    각자 데이터셋을 통해 전처리를 진행하였고, 노션에서 각자의 전처리를 공유하였다.

    크게는 프로모션이라는 틀이 있었는데, 그 안에서도 각자 다른 시각이 있어 다른 타이틀의 전처리가 나왔다.

     

    나는 가장 처음 숙박 고객의 유형을 알아보았다. 가족 여행객이 가장 많은 것을 알게 되었고 고객 유형별로 많이 방문한 지역을 코딩하였는데 계속 오류가 나서 넘겼다.

     

    지역별 방문자 수를 구해 서울이 가장 많은 관광객이 온다는 것을 알 수 있었다.

     

    숙박업 주소로 사람들이 많이 방문한 숙박업소를 구하였는데, 대체로 서울, 부산, 인천이 많았다.

     

    조식에 관련해서 조식과 관련된 상품을 이용한 사람, 조식을 이용하는 사람, 프로모션 대비 비율을 구하고 싶었는데, 이 중에서 조식을 먹는 사람과 아닌 사람의 비율만 찾았다 ㅠ.ㅠ

     

    패키지 프로모션과, 업그레이드 프로모션도 같은 시도를 했지만 ... 코드를 구상하는 능력이 부족해서인지 계속 오류가 나 팀원과 함께 짜보려고 한다.

     

    전처리를 공유하면서 주말을 어떻게 보낼 것인지 정하였고,  월~수의 일정을 구상하였다.

Designed by Tistory.