세조목

PYTHON 정리(데이터 타입 확인, 데이터 타입 변경, 상관관계, 값 대체)(23.12.19) 본문

데이터 분석 공부/Python

PYTHON 정리(데이터 타입 확인, 데이터 타입 변경, 상관관계, 값 대체)(23.12.19)

세조목 2023. 12. 19. 21:08
  • 본 내용들은 PYTHON을 공부하면서 차후 제가 복습하기위해 정리해놓은 것으로 제가 새롭게 알게된 내용들만을 정리하였습니다. 또한 배움이 부족하여 미처 다 파악하지 못한 부분들도 많으니 혹시나 이 포스팅을 보시는 분들께서는 다른 포스팅, 도서, 강의도 함께 참고하시기 바라겠습니다.

 

1. 테이블.dtypes

테이블 內 모든 컬럼의 데이터 타입을 확인

2. 테이블.apply(pd.to_numeric)

테이블 內 모든 컬럼의 데이터 타입을 int로 변경

데이터프레임에 반영할 때는 apply 메소드를 사용해야하지만

일반적으로 pd.to_numeric의 구조는 아래와 같다.

pd.to_numeric(숫자로 바꾸고자하는 컬럼명)

 

3. 테이블.corr(method='pearson')

상관관계를 측정할 때 사용하는데 사용 時 오류가 발생할 경우

변수.corr(numeric_only = True(or False)) 를 적으면 된다.

4. 테이블['컬럼명'].str.replace("before 텍스트", "after 텍스트")

특정 컬럼의 특정값을 대체할 때 사용할 수 있다.

예를 들어 'sports'라는 테이블의 baseball이라는 컬럼에서 34를 모두 27로 바꾸고싶을때는

sports['baseball'].str.replace(34, 27) 로 적으면 된다.