일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 머신러닝
- Chat GPT
- 크롤링
- streamlit
- If
- 전처리
- 프롬프트 엔지니어링
- cross join
- 기초통계
- pandas
- 시각화
- SQL
- GA4
- data analyst
- 히트맵
- 최종 프로젝트
- jd
- 군집화
- SQLD
- 태블로
- 팀프로젝트
- Python
- lambda
- 데이터 분석
- da
- 데이터분석
- 프로젝트
- 기초프로젝트
- 서브쿼리
- 클러스터링
- Today
- Total
목록Python (224)
세조목
PYTHON 2024.01.25 - [데이터 분석 공부/Python] - Python 정리(새로운 컬럼 만들기 = assign, 날짜 타입으로 변경 = pd.to_datetime, 요일을 숫자로 추출 = dt.weekday)(24.01.25) Python 정리(새로운 컬럼 만들기 = assign, 날짜 타입으로 변경 = pd.to_datetime, 요일을 숫자로 추출 = dt. assign 메서드는 DataFrame에 새로운 컬럼을 할당하는 메서드이다. 만약 기존 컬럼의 이름과 신규 컬럼의 이름이 같다면 신규 컬럼의 이름으로 덮어쓴다. log_date = ['19-02-01', '19-02-02', '19-02-03', '19-02-04' eyeoftheworld1209.tistory.com 2024.0..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/lWhoR/btsDWSwG4FT/0e26vXCOodefztB4I7EFpk/img.png)
1. 차트 개괄 df = pd.DataFrame({ 'A' : [1,2,3,4,5], 'B' : [5,4,3,2,1] }) df.plot(x='A', y='B') 위와 같이 만든 데이터프레임이 있을때 x축과 y축에 각각의 컬럼 이름을 넣어주면 간단하게 그래프를 그릴 수 있다. data_grouped = data.groupby('year')[['year', 'passengers']].sum() 위와 같은 데이터 프레임을 그래프로 나타낼때는 plt.plot(data_grouped['year'], data_grouped['passengers']) plt.plot( )안에 세로축에 넣을 컬럼, 가로축에 넣을 컬럼을 순서대로 넣어주는 식으로도 차트를 그릴 수 있다. x = [1,2,3,4,5] y = [2,4,6..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cWL7MS/btsDY6OrPO7/KVmyQr1bhQF4CgD2vAHdn0/img.png)
assign 메서드는 DataFrame에 새로운 컬럼을 할당하는 메서드이다. 만약 기존 컬럼의 이름과 신규 컬럼의 이름이 같다면 신규 컬럼의 이름으로 덮어쓴다. log_date = ['19-02-01', '19-02-02', '19-02-03', '19-02-04', '19-02-05', '19-02-06', '19-02-07', '19-02-08', '19-02-09', '19-02-10', '19-02-11', '19-02-12', '19-02-13', '19-02-14', '19-02-15', '19-02-16', '19-02-17', '19-02-18', '19-02-19', '19-02-20', '19-02-21', '19-02-22', '19-02-23', '19-02-24', '19-02-2..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/btf5La/btsDRmZgxfo/jhQGd5cIbm230S5MnZSyxk/img.png)
1. 인덱스 1) 인덱스 제거 방법 1 - 데이터 저장 時 data.to_csv("tips_data.csv", index=False) 2) 인덱스 제거 방법 2 - 데이터 불러올 時 df = pd.read_csv("tips_data.csv", index_col=0) 3) 인덱스 설정 df = pd.DataFrame({'A': [1,2,3], 'B' : ['a','b','c']}, index = ['idx3', 'idx2', 'idx1']) 2. DataFrame 만들기 data = {'name' : ['Alice', 'Bob', 'Charlie'], 'age' : [25,30, 35], 'gender' : ['female', 'male', 'male'] } df = pd.DataFrame(data) 3...