일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 전처리
- lambda
- 히트맵
- Python
- 팀프로젝트
- 데이터분석
- 데이터 분석
- 클러스터링
- 기초프로젝트
- 시각화
- 최종 프로젝트
- 군집화
- 서브쿼리
- Chat GPT
- SQLD
- da
- 프로젝트
- 기초통계
- 태블로
- GA4
- 프롬프트 엔지니어링
- pandas
- jd
- If
- 머신러닝
- cross join
- data analyst
- streamlit
- 크롤링
- SQL
- Today
- Total
목록데이터분석 (170)
세조목
최종 프로젝트 2024.04.09 - [데이터 분석 공부/프로젝트] - 최종 프로젝트 14일차(24.04.09) 최종 프로젝트 14일차(24.04.09) 최종 프로젝트 14일차입니다. 금일은 Review_score 전처리 작업 끝난 데이터셋 통합 전처리 작업 '구' 평균 평점으로 평점 결측치 채우기 Review_count 컬럼값 콤마 & .0 지우기 주소 변경 경사도 추가 GPT eyeoftheworld1209.tistory.com 최종 프로젝트 14일차였습니다. 데이터 전처리, 경사도 추가, gpt api 코드 작성, gpt 프롬프트 작성 등의 작업을 수행했는데요, 자세한 내용은 위 포스팅에 정리해두었습니다.
최종 프로젝트 8일차입니다. 코드를 돌렸을때 자잘한 문제들이 발생해서 금일은 해당 코드들을 수정했습니다. 자잘한 문제들이라 하면 대부분 가게의 데이터를 크롤링할 때는 정상 작동하던 코드가 일부 가게에서는 작동이 안 된다던가 네이버 지도 마지막 페이지의 데이터들은 크롤링이 안 된다던가 하는 문제입니다. 첫 번째 문제의 경우 방법을 찾지 못했으나 해당되는 가게의 수가 5개 이하이기때문에 별도로 수정하지 않고 진행해도 무방할 것 같다는 판단이며 두 번째 문제의 경우 앞전에 작동이 안 되어 수정했던 코드를 다시 기존 코드로 수정하니 작동했습니다. review_nums = driver.find_elements(By.CLASS_NAME,'owAeM') for review_num in review_nums: revi..
최종 프로젝트 2024.03.27 - [데이터 분석 공부/프로젝트] - 최종 프로젝트 2일차(24.03.27) 최종 프로젝트 2일차(24.03.27) 최종 프로젝트 2일차입니다. 금일은 저희가 어제 선정했던 프로젝트의 주제를 가지고서 어떻게 분석을 해볼지에 대한 이야기를 나눴습니다. 저희가 오늘 고민했던건 '과연 데이터셋을 어떻게 eyeoftheworld1209.tistory.com 최종 프로젝트 2일차였습니다. 어제 선정한 프로젝트 주제를 가지고서 어떻게 분석해볼 수 있을지에 대해 구체적으로 얘기나눴고, 각자 크롤링을 진행했습니다. 자세한 내용은 위 포스팅에 정리해두었습니다.
금일은 최종 프로젝트 관련 회의 진행 및 튜터님과의 질의응답 시간을 가졌습니다. 사전캠프 팀원들과 함께 최종 프로젝트를 진행했으면 해서 현재 해당 멤버들과 주제 구상 및 고민을 하고있는데 저희가 한 팀이 되어 최종 프로젝트를 진행할 수 있다면 선정할 주제는 '외식업종 상권 및 입지 선택을 위한 행정동 & 업종별 매출 예측 모델링' 입니다. 어떠한 데이터를 사용할지에 대해서 얘기 나눴고, 해당 데이터들을 가지고서 어떻게 데이터셋을 구상할 지, 어떤 머신러닝 모델을 활용할 수 있을지에 대해 함께 고민했습니다. Q.1 데이터셋 관련 1) 대용량 데이터라고 불리려면 '행의 개수'가 몇 개 정도 됐을 때 대용량 데이터라고 할 수 있나요? 2) 대용량 데이터셋을 구축한다고했을때 데이터셋을 하나로, n개로 나누는 것..