일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 기초통계
- pandas
- SQLD
- jd
- 서브쿼리
- Chat GPT
- 태블로
- 시각화
- 크롤링
- 프로젝트
- da
- SQL
- cross join
- 전처리
- 최종 프로젝트
- Python
- 군집화
- 팀프로젝트
- data analyst
- 데이터분석
- lambda
- If
- streamlit
- GA4
- 클러스터링
- 기초프로젝트
- 히트맵
- 프롬프트 엔지니어링
- 머신러닝
- 데이터 분석
- Today
- Total
목록크롤링 (26)
세조목
최종 프로젝트 14일차입니다. 금일은 Review_score 전처리 작업 끝난 데이터셋 통합 전처리 작업 '구' 평균 평점으로 평점 결측치 채우기 Review_count 컬럼값 콤마 & .0 지우기 주소 변경 경사도 추가 GPT API 코드 작성 GPT 프롬프트 고민 를 진행했습니다. Review_score 전처리 작업 끝난 데이터셋 통합 Review_score 결측치 처리 작업이 어제부로 끝났습니다. 전체 파일을 1/4해서 파일 한 개당 팀원 한 명이 붙어서 작업을 했다보니 파일을 다시 통합할 필요가 있었습니다. # 페이지별 데이터셋 불러오기 total_1 = pd.read_csv("N:/개인/DA/Python/크롤링/final_project/after_cleansing/통합본/total_1_after..
최종 프로젝트 2024.04.08 - [데이터 분석 공부/프로젝트] - 최종 프로젝트 13일차(24.04.08) 최종 프로젝트 13일차(24.04.08) 최종 프로젝트 13일차입니다. https://teamsparta.notion.site/29b19ca91bd248539e51ed87ff2d5cd1 전처리 진행 상황 | Notion 네이버 : 은평구, 서대문구(완), 마포구(완), 성북구, 종로구, 중구, 동대문구(완), 강남구(완 eyeoftheworld1209.tistory.com 최종 프로젝트 13일차입니다. 데이터셋 합치기부터 전처리 작업까지 타이트한 일정을 보낸 하루였는데요, 자세한 내용은 위 포스팅에 정리해두었습니다.
최종 프로젝트 2024.04.07 - [데이터 분석 공부/프로젝트] - 최종 프로젝트 11일~12일차(24.04.06~07) 최종 프로젝트 11일~12일차(24.04.06~07) 최종 프로젝트 11일, 12일차입니다. 토요일인 어제와 오늘은 크롤링 작업을 이어나갔습니다. 10일차 포스팅에서 설명했던 리뷰 텍스트 더보기 이슈 관련해서 코드를 수정한 후 크롤링에 소요되는 eyeoftheworld1209.tistory.com 최종 프로젝트 11~12일차입니다. 크롤링 작업 최종적으로 진행했고, 시간 여유가 있어서 전처리 작업 추가적으로 진행했습니다. 자세한 내용은 위 포스팅에 정리해두었습니다.
최종 프로젝트 13일차입니다. https://teamsparta.notion.site/29b19ca91bd248539e51ed87ff2d5cd1 전처리 진행 상황 | Notion 네이버 : 은평구, 서대문구(완), 마포구(완), 성북구, 종로구, 중구, 동대문구(완), 강남구(완) teamsparta.notion.site 금일 진행 사항들인데요, 간략하게 정리하자면 아래와 같습니다. 페이지별 데이터셋 합치고 전처리 작업 진행 Review_text 컬럼 결측치 제거 '시/구' 단위까지만 존재하는 컬럼 삽입 Review_text 컬럼값의 개행을 띄워쓰기로 대체, Store 컬럼값의 띄워쓰기 제거 프랜차이즈 점포 데이터 제거 구별 데이터셋 합치기 플랫폼별 데이터셋 합치기 가게명 통일 Review_score 결..