일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 데이터분석
- If
- 군집화
- 시각화
- Chat GPT
- 히트맵
- 태블로
- GA4
- 전처리
- lambda
- 팀프로젝트
- Python
- 크롤링
- pandas
- jd
- 기초통계
- 프로젝트
- data analyst
- 프롬프트 엔지니어링
- da
- SQL
- 기초프로젝트
- 머신러닝
- cross join
- SQLD
- 최종 프로젝트
- 클러스터링
- streamlit
- 데이터 분석
- 서브쿼리
Archives
- Today
- Total
세조목
Python - shape속성 & loc와 iloc의 차이 본문
shape
shape는 데이터 프레임의 행과 열을 알려주는 속성이다.
메서드가 아닌 속성이기때문에 아래와같이 소괄호를 제외하고 써줘야 한다.
df.shape
loc
행 이름을 기준으로 행 추출
iloc
행 번호(행 위치)를 기준으로 행 추출
범위를 지정해서 인덱싱을 할 때 마지막 숫자는 포함하지 않는다.
loc와는 다르게 뒤에서 n번째 행을 찾을때 '-' 를 사용할 수 있다.
how? iloc는 행 이름이 아닌 행 번호(행 위치)로 작동하기 때문이다.
아래의 경우 맨 마지막 행을 인덱싱한 것이다.
앞서 loc는 행 이름을, iloc는 행 번호를 기준으로 추출한다고 적었다.
두 속성 모두 열을 지정할수도 있는데 대괄호([ ])의 열 부분에 loc의 경우 숫자를, iloc의 경우 문자를 적으면
오류가 발생한다.
예를들어
loc는 행 이름을 기준으로 추출하기때문에 열 부분에 문자를 적어야 한다고 했는데 숫자를 적을 경우 아래와 같이
오류가 발생한다.
반대로 iloc는 행 번호를 기준으로 추출하기때문에 열 부분에 숫자를 적어야 한다고 했는데 문자를 적을 경우 아래와 같이
숫자를 필요로한다는 오류 메시지가 뜬다.
아래 이미지가 제대로 인자를 입력했을때의 결과값이다.
iloc는 추출하고자하는 열을 지정할 때
앞선 예시에서처럼 각각의 열 번호를 모두 적어줄 필요없이
' : '를 활용하여 정할 수 있다.
예를 들어
df.iloc[:,:4]
라고 적으면 첫번째 열부터 네번째 열까지를 추출할 수 있다.
'데이터 분석 공부 > Python' 카테고리의 다른 글
Python - 긴 코드의 가독성 높이기(역슬래시, 메서드 체이닝) (0) | 2024.03.12 |
---|---|
Python - lambda함수 (0) | 2024.03.11 |
Python 예제(3진법 뒤집기) (0) | 2024.02.26 |
Python 정리(데이터 카운팅 - count, size, value_counts, unique, nunique)(24.02.07) (1) | 2024.02.07 |
Python 정리(replace, shape, enumerate)(24.02.03) (0) | 2024.02.03 |