ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Colab으로 데이터 분석하기 (3)
    카테고리 없음 2023. 12. 20. 22:40

    (2)번과 같은 흐름으로 2주차 추가 실습과 과제 과정을 기록하고자 한다.

     

    1) 추가 실습

    #문제 정의 및 가설 설정

    -나이대별로 생존율과의 관계

     

    #데이터 분석 기본 세팅

    #데이터 분석

    #시각화

     

    #결과

    해당 데이터에서 데이터의 공백은 Age 영역에서 177개 존재하였고,

    승객의 나이에 대한 분포를 표현한 것으로 20대 초반이 가장 많았다.

    새로운 그래프를 나타내기 위해 Age의 막대를 0,3,7,15,30,60,100으로 나누고, 각각, baby, childern, teenage, young, adult, old라는 새로운 라벨을 부여하여, 나이대별로 생존율을 알아보았다.

    그 결과 baby와 children의 생존률이 높았다.

     

    2) 과제

    #문제 정의 및 가설 설정

    -가설 : 당뇨별 발병에 가장 큰 영향을 미치는 요소는 글루코스 수치

    ->결과와 글루코스 간의 상관관계

     

    #데이터 분석 기본 세팅

    #데이터 분석

    #시각화

    #결론

    해당 데이터는 결측치 및 공백인 자료가 없었으며,

    Outcome을 기준으로 보았을 때 Glucose의 상관계수가 0.4 이상으로 높은 상관관계를 보여주고 있다는 결론을 낼 수 있었다.

Designed by Tistory.