일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- streamlit
- 기초통계
- 머신러닝
- pandas
- 데이터분석
- 최종 프로젝트
- SQL
- 데이터 분석
- 프로젝트
- 클러스터링
- 프롬프트 엔지니어링
- lambda
- GA4
- SQLD
- 전처리
- 시각화
- data analyst
- 서브쿼리
- 기초프로젝트
- Python
- da
- 히트맵
- cross join
- 크롤링
- Chat GPT
- If
- jd
- 태블로
- 군집화
- 팀프로젝트
Archives
- Today
- Total
세조목
PYTHON 정리(데이터 타입 확인, 데이터 타입 변경, 상관관계, 값 대체)(23.12.19) 본문
- 본 내용들은 PYTHON을 공부하면서 차후 제가 복습하기위해 정리해놓은 것으로 제가 새롭게 알게된 내용들만을 정리하였습니다. 또한 배움이 부족하여 미처 다 파악하지 못한 부분들도 많으니 혹시나 이 포스팅을 보시는 분들께서는 다른 포스팅, 도서, 강의도 함께 참고하시기 바라겠습니다.
1. 테이블.dtypes
테이블 內 모든 컬럼의 데이터 타입을 확인
2. 테이블.apply(pd.to_numeric)
테이블 內 모든 컬럼의 데이터 타입을 int로 변경
데이터프레임에 반영할 때는 apply 메소드를 사용해야하지만
일반적으로 pd.to_numeric의 구조는 아래와 같다.
pd.to_numeric(숫자로 바꾸고자하는 컬럼명)
3. 테이블.corr(method='pearson')
상관관계를 측정할 때 사용하는데 사용 時 오류가 발생할 경우
변수.corr(numeric_only = True(or False)) 를 적으면 된다.
4. 테이블['컬럼명'].str.replace("before 텍스트", "after 텍스트")
특정 컬럼의 특정값을 대체할 때 사용할 수 있다.
예를 들어 'sports'라는 테이블의 baseball이라는 컬럼에서 34를 모두 27로 바꾸고싶을때는
sports['baseball'].str.replace(34, 27) 로 적으면 된다.
'데이터 분석 공부 > Python' 카테고리의 다른 글
PYTHON 정리(점프투파이썬 - 문자열)(23.12.28) (1) | 2023.12.28 |
---|---|
PYTHON 정리(iterable, 조작적 정의, 인과관계&상관관계, round함수 유의사항)(23.12.26) (0) | 2023.12.27 |
PYTHON 정리(sorted, join, describe, 축 눈금 수정)(23.12.22) (0) | 2023.12.22 |
PYTHON 정리(제곱 & 제곱근, 특정 열(or 행) 제거, 히스토그램 & 바 그래프, groupby)(23.12.20) (0) | 2023.12.20 |
PYTHON 정리(정렬, 피벗테이블, 히트맵)(23.12.18) (2) | 2023.12.18 |