일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 군집화
- 프로젝트
- 서브쿼리
- Python
- 태블로
- 팀프로젝트
- 히트맵
- 데이터분석
- 전처리
- jd
- 시각화
- data analyst
- 머신러닝
- cross join
- Chat GPT
- pandas
- If
- 크롤링
- 최종 프로젝트
- 데이터 분석
- 프롬프트 엔지니어링
- da
- streamlit
- SQL
- SQLD
- 클러스터링
- 기초프로젝트
- GA4
- 기초통계
- lambda
- Today
- Total
세조목
SQL 예제 정리('자동차 대여 기록에서 대여 중/대여 가능 여부 구분하기') 본문
https://school.programmers.co.kr/learn/courses/30/lessons/157340#qna
2022년 10월 16일에
대여 중인 자동차는 '대여 중'(반납 날짜가 16일 경우도 포함됨)
대여 중이지 않은 자동차인 경우에는 '대여 가능'
으로 표시하는 문제입니다.
이 문제의 쿼리문 작성 자체는 어렵지 않았는데요,
제가 작성한 쿼리문이 계속해서 오답처리가 됐습니다.
우선 제가 작성한 쿼리문 먼저 보여드리겠습니다.
총 두 가지 버전이 있는데요, 하나씩 살펴보겠습니다.
Ver.1
SELECT CAR_ID, START_DATE, END_DATE,
IF(START_DATE <= '2022-10-16' AND END_DATE >= '2022-10-16', '대여중', '대여 가능') AVAILABILITY
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
GROUP BY CAR_ID
HAVING MAX(END_DATE)
ORDER BY CAR_ID DESC;
일단 CAR_ID별로 날짜가 다양하기때문에
- CAR_ID 기준 GROUP BY 한 후
- END_DATE가 가장 큰(최근) 데이터만을 필터링합니다.
- 그렇게 했을 때 START_DATE가 10월 16일 미만이고,
- END_DATE가 10월 16일 이후이면(16일 포함) 대여중으로, 그렇지 않으면 대여 가능으로 표시하는 쿼리입니다.
이 쿼리문의 경우 MAX를 썼던게 문제였던 것 같습니다.
Ver.2
SELECT A.CAR_ID,
IF(A.START_DATE <= '2022-10-16' AND A.END_DATE >= '2022-10-16', '대여중', '대여 가능') AVAILABILITY
FROM
(
SELECT CAR_ID,
START_DATE,
END_DATE,
ROW_NUMBER() OVER(PARTITION BY CAR_ID ORDER BY END_DATE DESC) NUM
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
) A
WHERE A.NUM = 1
ORDER BY A.CAR_ID DESC;
다음 쿼리문입니다.
이 쿼리에서는 각 행의 순서를 나타내는 ROW_NUMBER() 함수를 사용해서
순서가 1인(=가장 최근인) 데이터를 필터링하고,
Ver.1에서와 마찬가지로 그 행의 START_DATE가 16일 미만인지, END_DATE가 16일 이후인지를 판단합니다.
이 쿼리문도 마찬가지로 오답처리 됐습니다.
SELECT CAR_ID,
MAX(IF(START_DATE <= '2022-10-16' AND END_DATE >= '2022-10-16', '대여중', '대여 가능')) AVAILABILITY
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
GROUP BY CAR_ID
ORDER BY CAR_ID DESC;
위 쿼리문이 정답 쿼리문인데요,
찾아보니 이 문제는 아스키 코드를 염두에 뒀을 가능성이 있다고 했습니다.
무슨 말이냐 하면 아스키 코드에서는 '공백'이 다른 어떤 문자보다 그 값이 작다고 하는데요,
'대여중' 과 '대여 가능'을 비교했을 때 '대여 가능'이 '대여중'보다 값이 작기 때문에
MAX를 씌웠을 때 '대여중'이 나타나는 것입니다.
쿼리문이 실행되는 순서가 아래와 같기때문에
FROM → GROUP BY → SELECT → ORDER BY
CAR_ID로 그룹이 지어지고,
START_DATE와 END_DATE가 각각 16일 미만인지, 16일 이후인지를 판단해서 '대여중', '대여 가능'을 뽑아내는데
'대여중', '대여 가능'이 혼재되어있을 것이기때문에 이 때 MAX 함수를 써서 '대여중'만을 뽑아낸다는 것으로 이해할 수 있습니다.
그러니까 CAR_ID별로 '대여중'이 하나라도 있으면 '대여중'으로 표시되게끔 쿼리를 작성한 것이죠.
'데이터 분석 공부 > SQL' 카테고리의 다른 글
SQL 예제 정리('주문량이 많은 아이스크림들 조회하기')(24.05.04) (0) | 2024.05.04 |
---|---|
SQL 예제 정리('우유와 요거트가 담긴 장바구니')(24.05.03) (0) | 2024.05.03 |
SQL 예제 정리('재구매가 일어난 상품과 회원 리스트 구하기') (1) | 2024.05.01 |
SQL 예제 정리(프로그래머스 - '즐겨찾기가 가장 많은 식당 정보 출력하기') (0) | 2024.05.01 |
SQL 예제(Consecutive Numbers)(Lead 함수) (0) | 2024.02.22 |