카테고리 없음

스프레드 시트로 데이터 분석하기(2)

설득이 2023. 12. 19. 15:15

어제 스프레드 시트로 스타벅스 데이터를 분석을 시도하였다.

칼로리와 당의 상관관계를 분석하기 위해, 칼로리가 높으면 당도 높다.라는 가설을 세워 스프레드 시트를 활용해서 데이터 분석을 하였다.

그러나, 계속해서 아래와 같은 창이 계속 떴다.

여러차례 해결방안을 찾아보았지만, 도저히 못찾아서 오늘 다시 도전하였다.

 

오늘은 오류창을 먼저 해석해보았다.

input 은 분석할 시작점과 끝점을 적는 곳이고, non-numeric은 숫자가 아니라는 것이다. 오류창을 해석한 결과, 내가 지정한 범위가 숫자가 아니라는 것을 알게되었고, 스프레드를 사용할 때에는 숫자만 있는 데이터를 사용한다는 것을 깨달았다.

 

그래서 텍스트와 기호가 있는 전 범위가 아니라, 숫자만 있는 범위를 지정하였는데도 오류창이 또 떠서 튜터님께 도움을 요청했다.

 

튜터님의 도움을 통해 데이터의 서식이 자동이라는 것을 알게 되었고, 서식을 숫자로 바꾸자 분석이 되었다.

 

 

표를 통해 칼로리와  당의 상관관계는 매우 높다라는 것을 알 수 있었다.

이를 시각화 해보았다.

시각화를 통해서도 sugars, 당이 높은 상관관계를 가지고 있다는 것을 알 수 있었다.