데이터 분석 공부/Python
PYTHON 정리(데이터 타입 확인, 데이터 타입 변경, 상관관계, 값 대체)(23.12.19)
세조목
2023. 12. 19. 21:08
- 본 내용들은 PYTHON을 공부하면서 차후 제가 복습하기위해 정리해놓은 것으로 제가 새롭게 알게된 내용들만을 정리하였습니다. 또한 배움이 부족하여 미처 다 파악하지 못한 부분들도 많으니 혹시나 이 포스팅을 보시는 분들께서는 다른 포스팅, 도서, 강의도 함께 참고하시기 바라겠습니다.
1. 테이블.dtypes
테이블 內 모든 컬럼의 데이터 타입을 확인
2. 테이블.apply(pd.to_numeric)
테이블 內 모든 컬럼의 데이터 타입을 int로 변경
데이터프레임에 반영할 때는 apply 메소드를 사용해야하지만
일반적으로 pd.to_numeric의 구조는 아래와 같다.
pd.to_numeric(숫자로 바꾸고자하는 컬럼명)
3. 테이블.corr(method='pearson')
상관관계를 측정할 때 사용하는데 사용 時 오류가 발생할 경우
변수.corr(numeric_only = True(or False)) 를 적으면 된다.
4. 테이블['컬럼명'].str.replace("before 텍스트", "after 텍스트")
특정 컬럼의 특정값을 대체할 때 사용할 수 있다.
예를 들어 'sports'라는 테이블의 baseball이라는 컬럼에서 34를 모두 27로 바꾸고싶을때는
sports['baseball'].str.replace(34, 27) 로 적으면 된다.