일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 히트맵
- GA4
- 태블로
- 데이터분석
- data analyst
- Python
- 크롤링
- 시각화
- cross join
- streamlit
- lambda
- 머신러닝
- 군집화
- 기초프로젝트
- 서브쿼리
- 프로젝트
- 팀프로젝트
- 전처리
- 데이터 분석
- Chat GPT
- 기초통계
- SQLD
- jd
- 프롬프트 엔지니어링
- SQL
- If
- 클러스터링
- da
- pandas
- 최종 프로젝트
Archives
- Today
- Total
세조목
Python 정리(replace, shape, enumerate)(24.02.03) 본문
속성값 변경
df['컬럼명'] = df['컬럼명'].replace('기존값', '수정값')
ex) df['name'] = df['name'].replace('Joe', 'Kane')
※ 특정 열의 특정 값만 바꾸고자 할 때
df.replace({컬럼명 : 기존값}, 수정값)
차원 확인(shape)
변수명.shape
분리한 데이터셋의 차원을 볼 수 있음
차원이란 '데이터셋에 포함된 값의 개수', '독립변수의 개수'를 의미함
다시말해 행과 열의 개수를 알려준다.
shape는 속성이기때문에 ()를 붙여주면 안 된다.
enumerate
enumerate 함수는 리스트의 원소에 인덱스를 부여하는 기능을 가지고있다.
예를들어
df = ['food', 'animal', 'date', 'people']
라는 리스트가 있고, 인덱싱을 하고자한다면
df = ['food', 'animal', 'date', 'people']
for i, val in enumerate(df):
print(i, val)
>>> 0 food
>>> 1 animal
>>> 2 date
>>> 3 people
위의 코드를 입력해주면 된다.
이때 val(val을 제외한 다른 이름으로 적어도 무방함)을 적어주지 않는다면
인덱스만 출력이 되니 유의하자
subplot
캔버스 하나에 여러 그래프가 출력되도록 하는 함수
plt.subplot(총 행 개수, 총 열 개수, 그래프 번호)
(내용 보완하여 별도로 포스팅할 예정)