일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- If
- 전처리
- da
- SQLD
- 프롬프트 엔지니어링
- GA4
- 크롤링
- Chat GPT
- 기초통계
- jd
- 기초프로젝트
- 군집화
- 태블로
- 데이터분석
- 팀프로젝트
- cross join
- Python
- pandas
- 서브쿼리
- 클러스터링
- 프로젝트
- 시각화
- 데이터 분석
- 히트맵
- streamlit
- 머신러닝
- data analyst
- SQL
- lambda
- 최종 프로젝트
- Today
- Total
목록데이터 분석 (130)
세조목
최종 프로젝트 13일차입니다. https://teamsparta.notion.site/29b19ca91bd248539e51ed87ff2d5cd1 전처리 진행 상황 | Notion 네이버 : 은평구, 서대문구(완), 마포구(완), 성북구, 종로구, 중구, 동대문구(완), 강남구(완) teamsparta.notion.site 금일 진행 사항들인데요, 간략하게 정리하자면 아래와 같습니다. 페이지별 데이터셋 합치고 전처리 작업 진행 Review_text 컬럼 결측치 제거 '시/구' 단위까지만 존재하는 컬럼 삽입 Review_text 컬럼값의 개행을 띄워쓰기로 대체, Store 컬럼값의 띄워쓰기 제거 프랜차이즈 점포 데이터 제거 구별 데이터셋 합치기 플랫폼별 데이터셋 합치기 가게명 통일 Review_score 결..
최종 프로젝트 11일, 12일차입니다. 토요일인 어제와 오늘은 크롤링 작업을 이어나갔습니다. 10일차 포스팅에서 설명했던 리뷰 텍스트 더보기 이슈 관련해서 코드를 수정한 후 크롤링에 소요되는 시간이 훨씬 늘어났는데 1페이지당 3시간 정도 소요됐습니다. * 리뷰 텍스트 더보기 이슈 관련 내용은 아래 포스팅 참고 2024.04.05 - [데이터 분석 공부/프로젝트] - 최종 프로젝트 10일차(24.04.05) 최종 프로젝트 10일차(24.04.05) 최종 프로젝트 10일차입니다. 오전에 팀원들과 어제 못다한 얘기를 가지고서 회의를 진행했습니다. 특성 정하기 Chat GPT 활용한 리뷰 긍/부정 및 특성별 점수 매기기 샘플 테스트 RAG 이야기 주제 eyeoftheworld1209.tistory.com 총 8..
최종 프로젝트 2024.04.05 - [데이터 분석 공부/프로젝트] - 최종 프로젝트 10일차(24.04.05) 최종 프로젝트 10일차(24.04.05) 최종 프로젝트 10일차입니다. 오전에 팀원들과 어제 못다한 얘기를 가지고서 회의를 진행했습니다. 특성 정하기 Chat GPT 활용한 리뷰 긍/부정 및 특성별 점수 매기기 샘플 테스트 RAG 이야기 주제 eyeoftheworld1209.tistory.com 최종 프로젝트 10일차입니다. 금일은 코드 수정 및 튜터님들과의 질의응답 시간을 가졌습니다. 자세한 내용은 위 포스팅에 정리해두었습니다.
최종 프로젝트 10일차입니다. 오전에 팀원들과 어제 못다한 얘기를 가지고서 회의를 진행했습니다. 특성 정하기 Chat GPT 활용한 리뷰 긍/부정 및 특성별 점수 매기기 샘플 테스트 RAG 이야기 주제는 위 세가지였습니다. 1. 특성정하기 특성은 네이버 플레이스에서 확인할 수 있는 특성들을 일부 수정 및 추가해서 사용하기로 했습니다. 2. Chat GPT 활용한 리뷰 긍/부정 및 특성별 점수 매기기 샘플 테스트 아직 API 활용법을 숙지하지 못한 상태였기 때문에 1, 2개 정도의 리뷰를 가지고서 프롬프트 창에 요구사항을 입력하고 결과값을 확인했습니다. 확인 결과 GPT 3.5가 확실히 GP4에 비해 정확도가 떨어졌습니다. 3. RAG (Retrieval-Augmented Generation) 기존 LLM..