-
코드카타/태블로[스파르타코딩클럽]데이터분석 과정/TIL,WIL 2024. 2. 21. 20:58
SQL 코드카타
보호소에서 중성화한 동물
보호소에서 중성화 수술을 거친 동물 정보를 알아보려 합니다. 보호소에 들어올 당시에는 중성화되지 않았지만,
보호소를 나갈 당시에는 중성화된 동물의 아이디와 생물 종, 이름을 조회하는 아이디 순으로 조회하는 SQL 문- 보호소, 유형 테이블 : 조인
- 중성화 : intact%
SELECT i.ANIMAL_ID,i.ANIMAL_TYPE,i.NAME FROM ANIMAL_INS i JOIN ANIMAL_OUTS o ON i.ANIMAL_ID = o.ANIMAL_ID WHERE i.SEX_UPON_INTAKE LIKE "Intact%" and o.SEX_UPON_OUTCOME NOT LIKE "Intact%" ORDER BY i.ANIMAL_ID
Count Salary Categories
Write a solution to calculate the number of bank accounts for each salary category.
The salary categories are:
"Low Salary": All the salaries strictly less than $20000.
"Average Salary": All the salaries in the inclusive range [$20000, $50000].
"High Salary": All the salaries strictly greater than $50000.
The result table must contain all three categories. If there are no accounts in a category, return 0.- income < 20000
- union
SELECT "Low Salary" AS category, COUNT(income) AS accounts_count FROM Accounts WHERE income < 20000 UNION SELECT "Average Salary" AS category, COUNT(income) AS accounts_count FROM Accounts WHERE income >= 20000 AND income <= 50000 UNION SELECT "High Salary" AS category, COUNT(income) AS accounts_count FROM Accounts WHERE income > 50000;
Weather Observation Station 16
Query the smallest Northern Latitude (LAT_N) from STATION that is greater than 38.7780
Round your answer to 4 decimal places.- round : round(,4)
- the smallest : min(lat_n)
- greather than 38.7780 : where lat_n > 38.7780
SELECT ROUND(MIN(LAT_N),4) FROM STATION WHERE LAT_N > 38.7780;
파이썬 코드카타
햄버거 만들기
상수의 앞에 쌓이는 재료의 순서가 [야채, 빵, 빵, 야채, 고기, 빵, 야채, 고기, 빵]일 때, 상수는 여섯 번째 재료가 쌓였을 때, 세 번째 재료부터 여섯 번째 재료를 이용하여 햄버거를 포장하고, 아홉 번째 재료가 쌓였을 때, 두 번째 재료와 일곱 번째 재료부터 아홉 번째 재료를 이용하여 햄버거를 포장합니다. 즉, 2개의 햄버거를 포장하게 됩니다.
상수에게 전해지는 재료의 정보를 나타내는 정수 배열 ingredient가 주어졌을 때, 상수가 포장하는 햄버거의 개수를 return하도록 solution 함수를 완성def solution(ingredient): temp = [] answer = 0 for i in ingredient: temp.append(i) if temp[-4:] == [1,2,3,1]: answer += 1 for j in range(4): temp.pop() return answer
태블로
- BI (비즈니스 인텔리전스)
조직이 좀 더 데이터 기반의 의사 결정을 빠르게 할 수 있도록 서포트하는 비즈니스 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구를 말함
- 데이터 시각화
- 표현 방식
텍스트 테이블, 히트맵, 맵 차트, 파이 차트, 막대 차트, 트리맵, 라인 차트, 영역 차트, 분산형 차트, 박스 플랏
- 데이터 시각화의 장점
데이터를 빠르게 이해하고 의사결정 할 수 있다.
실무에서 협업할 때, 효과적으로 커뮤니케이션 할 수 있다.
직관적인 데이터의 이해를 통해 인사이트를 도출할 수 있다.
- 선 그래프
간단하고 사용하기 쉬움
시계열 데이터를 시각화할 경우, 변화량과 트렌드를 한 눈에 보기 용이
연속적인 데이터에 사용하기 적합- 막대 그래프
간단하고 사용하기 쉬움
범주 간의 차이나 분포를 시각적으로 이해하기 쉬움
범주형 데이터에 사용하기 적합- 맵 차트
지도를 활용해서 지리적 위치를 살펴볼 수 있다
각 지역별 데이터의 분포 및 비중을 한 눈에 확인할 때 사- 파이 차트
각 부분의 크기가 상대적인 비율이기 때문에 각 부분이 전체에서 차지하는 비중을 쉽게 이해할 수 있음
데이터의 구성 비율과 분포를 한눈에 파악
다양한 변수를 다루기에는 적합하지 않을 수 있다
변수가 적을 때 직관적으로 사용하기 용이- 트리맵 차트
데이터를 계층적으로 표현하는 데 사용
카테고리별로 특정 데이터 집합이 전체 데이터에서 차지하는 비율을 면적으로 표현하여 카테고리별 구성 요소를 한눈에 파악- 도넛 차트
파이 차트와 비슷한 형태로 가운데 구멍이 뚫린 경우를 도넛 차트
각 부분의 크기가 상대적인 비율이기 때문에 각 부분이 전체에서 차지하는 비중을 쉽게 이해- 히트맵 차트
색상을 활용해서 데이터 값을 시각적으로 강조함
색상의 그라데이션을 통해 측정값들을 한 눈에 비교- 영역 차트
선 아래 영역을 색으로 채워서 데이터의 영역 크기를 파악할 수 있다
시간에 따른 데이터의 추이를 시각적으로 나타남
데이터의 변화 및 흐름을 쉽게 파악- 스택 플랏
상대적인 비율을 직관적으로 시각화
시간에 따라 데이터가 어떻게 변하는지 시각적으로 알 수 있음
단순 누적 그래프는 기준선이 일정하지 않기 떄문에 비교하기가 어려움
100% 누적 그래프를 활용하면 기준을 비교하기 쉬움- 콤보차트
하나의 차원을 두 개 이상의 측정값으로 동시에 파악하고 싶을 때 이중축을 활용
이중 축 차트를 사용하면 두 가지 서로 다른 데이터 집합을 한 번에 비교할 수 있음
축에 서로 다른 단위나 기준을 가지고 있는 경우, 그래프를 볼 때 한눈에 알아보기 어려움- 평균선/참조선
분석 패널에서 평균선 라인/상수 라인/참조선을 추가해서 의사결정을 빠르게 할 수 있음
- 파레토 차트
파레토 법칙
전체 결과의 80%가 전체 원인의 20%에서 일어난다는 마케팅 기법'[스파르타코딩클럽]데이터분석 과정 > TIL,WIL' 카테고리의 다른 글
코드카타 (0) 2024.02.26 코드카타 (0) 2024.02.23 심화 프로젝트 (0) 2024.02.20 코드카타 (0) 2024.02.20 코드카타 / 프로젝트 (0) 2024.02.14