세조목

PYTHON 정리(원하는 row만 제거, 컬럼 순서 바꾸기, 컬럼명 변경)(24.01.10) 본문

데이터 분석 공부/Python

PYTHON 정리(원하는 row만 제거, 컬럼 순서 바꾸기, 컬럼명 변경)(24.01.10)

세조목 2024. 1. 10. 21:43

1. 원하는 row만 제거

pandas 라이브러리를 사용하여 데이터를 분석할때

내가 원하는 row만 제거하고싶다면 필터를 적용하는 것이 방법이 될 수 있다.

변수 = 테이블명['컬럼명'] =='제거하고싶은 속성값'

을 작성한 후

테이블명.drop(index=테이블명[변수].index)

를 해주면 된다.

예를 들어 아래와 같은 테이블이 있다고했을때

'행정구역별(시군구)'의 값이 '동부', '읍부', '면부'인 행은 지우고 싶다면('동부', '읍부', '면부'는 5행~331행 사이에 有)

d = people['행정구역별(시군구)'] == '동부'
u = people['행정구역별(시군구)'] == '읍부'
m = people['행정구역별(시군구)'] == '면부'
people = people.drop(index = people[d].index)
people = people.drop(index = people[u].index)
people = people.drop(index = people[m].index)

위와 같이 코드를 입력하면 된다.

 

2. 컬럼 순서 바꾸기

분석 작업을 하다보면 테이블 순서를 바꿔야할때가 있는데 간단하게 순서를 바꿀 수 있다.

테이블명 = 테이블명[['컬럼명', '컬럼명'...]]

이렇게 작성해주면 된다.

직관적으로 내가 출력하고자하는 순서대로 컬럼명을 적어주면 된다.

예를 들어 테이블이 위와 같고,

1열(20~24)과 2열(20세 미만)의 위치를 바꾸고싶다면

retention = retention[['20세 미만', '20~24', '25~29', '30~34', '35~39', '40~44', '45~49', '50~54', '55~59', '60~64', '65~69', '70~74', '75~79', '80~84', '85세 이상']]

위와 같이 코드를 입력하면 된다.

 

3. 컬럼명 변경

테이블.rename(columns={'변경 전 컬럼명' : '변경 후 컬럼명'}, inplace=True)

컬럼명을 바꾸고자 할 때는 위와 같이 코드를 입력하면된다.

'inplace=True'는 바꾼 값을 그대로 저장하겠다는 의미로 작성한 것이다.

만약 'inplace=True'를 입력하기 싫다면

테이블 = 테이블.rename~~~

과 같이 코드를 입력하면된다.

 

컬럼명 변경 예시 코드는 아래와 같다.

train_df2.rename(columns={'weekday' : 'day_of_the_week'}, inplace=True)