세조목

SQL 예제 정리('자동차 대여 기록에서 대여 중/대여 가능 여부 구분하기') 본문

데이터 분석 공부/SQL

SQL 예제 정리('자동차 대여 기록에서 대여 중/대여 가능 여부 구분하기')

세조목 2024. 5. 2. 20:45

https://school.programmers.co.kr/learn/courses/30/lessons/157340#qna

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

2022년 10월 16일에

대여 중인 자동차는 '대여 중'(반납 날짜가 16일 경우도 포함됨)

대여 중이지 않은 자동차인 경우에는 '대여 가능'

으로 표시하는 문제입니다.

 

이 문제의 쿼리문 작성 자체는 어렵지 않았는데요,

제가 작성한 쿼리문이 계속해서 오답처리가 됐습니다.

우선 제가 작성한 쿼리문 먼저 보여드리겠습니다.

총 두 가지 버전이 있는데요, 하나씩 살펴보겠습니다.

 

Ver.1

SELECT CAR_ID, START_DATE, END_DATE,
       IF(START_DATE <= '2022-10-16' AND END_DATE >= '2022-10-16', '대여중', '대여 가능') AVAILABILITY
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
GROUP BY CAR_ID
HAVING MAX(END_DATE)
ORDER BY CAR_ID DESC;

일단 CAR_ID별로 날짜가 다양하기때문에

  1. CAR_ID 기준 GROUP BY 한 후
  2. END_DATE가 가장 큰(최근) 데이터만을 필터링합니다.
  3. 그렇게 했을 때 START_DATE가 10월 16일 미만이고,
  4. END_DATE가 10월 16일 이후이면(16일 포함) 대여중으로, 그렇지 않으면 대여 가능으로 표시하는 쿼리입니다.

이 쿼리문의 경우 MAX를 썼던게 문제였던 것 같습니다.

 

Ver.2

 

SELECT A.CAR_ID,
       IF(A.START_DATE <= '2022-10-16' AND A.END_DATE >= '2022-10-16', '대여중', '대여 가능') AVAILABILITY
FROM
(
SELECT CAR_ID,
       START_DATE,
       END_DATE,
       ROW_NUMBER() OVER(PARTITION BY CAR_ID ORDER BY END_DATE DESC) NUM
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
) A
WHERE A.NUM = 1
ORDER BY A.CAR_ID DESC;

다음 쿼리문입니다.

이 쿼리에서는 각 행의 순서를 나타내는 ROW_NUMBER() 함수를 사용해서

순서가 1인(=가장 최근인) 데이터를 필터링하고,

Ver.1에서와 마찬가지로 그 행의 START_DATE가 16일 미만인지, END_DATE가 16일 이후인지를 판단합니다.

이 쿼리문도 마찬가지로 오답처리 됐습니다.

 

SELECT CAR_ID,
       MAX(IF(START_DATE <= '2022-10-16' AND END_DATE >= '2022-10-16', '대여중', '대여 가능')) AVAILABILITY
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
GROUP BY CAR_ID
ORDER BY CAR_ID DESC;

위 쿼리문이 정답 쿼리문인데요,

찾아보니 이 문제는 아스키 코드를 염두에 뒀을 가능성이 있다고 했습니다.

무슨 말이냐 하면 아스키 코드에서는 '공백'이 다른 어떤 문자보다 그 값이 작다고 하는데요,

'대여중' 과 '대여 가능'을 비교했을 때 '대여 가능'이 '대여중'보다 값이 작기 때문에

MAX를 씌웠을 때 '대여중'이 나타나는 것입니다.

 

쿼리문이 실행되는 순서가 아래와 같기때문에

FROM → GROUP BY  SELECT ORDER BY

CAR_ID로 그룹이 지어지고,

START_DATE와 END_DATE가 각각 16일 미만인지, 16일 이후인지를 판단해서 '대여중', '대여 가능'을 뽑아내는데

'대여중', '대여 가능'이 혼재되어있을 것이기때문에 이 때 MAX 함수를 써서 '대여중'만을 뽑아낸다는 것으로 이해할 수 있습니다.

그러니까 CAR_ID별로 '대여중'이 하나라도 있으면 '대여중'으로 표시되게끔 쿼리를 작성한 것이죠.