일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 기초프로젝트
- If
- 군집화
- 클러스터링
- 프롬프트 엔지니어링
- 크롤링
- 시각화
- 히트맵
- SQL
- Python
- 데이터분석
- 팀프로젝트
- data analyst
- SQLD
- 전처리
- pandas
- 데이터 분석
- lambda
- cross join
- Chat GPT
- 최종 프로젝트
- da
- GA4
- streamlit
- 기초통계
- 프로젝트
- 서브쿼리
- 머신러닝
- 태블로
- jd
- Today
- Total
목록데이터 분석 공부/프로젝트 (53)
세조목
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dBjkK5/btsGFhTE1cq/6C6JxgsqfsTlyoTf2wpp40/img.png)
최종 프로젝트 17일차입니다. 금일은 앞으로의 방향성에 대해서 팀원들과 얘기 나누고, 관련해서 튜터님들께 튜터링을 받았습니다. 튜터링 일단 오늘 튜터링 주제는 크게 두 가지였습니다. 앞으로의 방향성 관련 사용할 데이터 개수 관련 앞으로의 방향성 관련 방향성의 경우 저희가 최종적으로 만들고자 하는 서비스는 '추천' 시스템인데 이 '추천'이라는 것이 정확히 어떠한 알고리즘으로 만들어지는 것인지 알 수 없었습니다. 관련해서 전담 튜터님께 문의드린 결과 저희가 하고자 하는 것은 '추천'보다는 '검색'에 가깝다고 하셨습니다. 왜냐하면 '추천'이라는 것은 개개인의 특성에 맞춰서 특성에 맞는 무언가를 알려주는 것인데 저희가 하고자 하는 것은 그러한 개인의 특성에 맞춰서 알려주는 것이 아니기 때문입니다. ※ 저희는 사..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/8FZ9w/btsGAMAsUNN/FFeGx8eDbFVLvj3WGPZ2yK/img.png)
최종 프로젝트 16일차입니다. 금일은 프로젝트 중간 발표 날이었습니다. 중간발표는 무사히 잘 끝났습니다. 현재 저희 팀이 겪고 있는 문제는 gpt 4버전에서 gpt 3.5 버전을 사용해야하는 상황이 발생함에따라 프롬프트를 보다 정교하게 정리할 필요가 있다는 점입니다. """ Prerequisites: - **Enter 0 in all evaluation items and start evaluating.** - **All assessments must always return a result, even if you determine that the result is unnecessary.** - The reviews that need to be evaluated are in Korean - Minimize..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/17B6N/btsGzZSEgrK/SckYDo7zZKk9QmB7J19HB1/img.png)
최종 프로젝트 14~15일차입니다. 어제는 거의 하루종일 프롬프트 선정 작업 및 GPT API 테스팅 작업을 진행했습니다. 정확도 때문에라도 GPT4를 사용하는게 맞겠다싶어서 해당 버전을 사용하는 것으로 이야기가 모아졌습니다. GPT4 중에서도 TURBO 모델이 일반 4버전보다는 저렴해서 TURBO를 쓰기로 했는데요, 문제는 프롬프트를 입력했을 때 정확도가 들쭉날쭉하다는 문제가 있어서 계속해서 프롬프트를 수정했습니다. 이 작업만 거의 다섯시간 정도 했던 것 같습니다. 오후 4시쯤 돼서는 어느 정도 정리가 된 것 같아서 본격적으로 GPT API 테스팅을 시작했습니다. 일단 8달러 정도만 충전해서 테스팅했는데요, 저희가 생각했던 것보다 과금 속도가 빨랐습니다. 이대로 진행하다가는 13만건은 고사하고, 5만건..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/BaNmi/btsGvrXo42M/WIsz3CZepJncODfhBInfPK/img.png)
최종 프로젝트 14일차입니다. 금일은 Review_score 전처리 작업 끝난 데이터셋 통합 전처리 작업 '구' 평균 평점으로 평점 결측치 채우기 Review_count 컬럼값 콤마 & .0 지우기 주소 변경 경사도 추가 GPT API 코드 작성 GPT 프롬프트 고민 를 진행했습니다. Review_score 전처리 작업 끝난 데이터셋 통합 Review_score 결측치 처리 작업이 어제부로 끝났습니다. 전체 파일을 1/4해서 파일 한 개당 팀원 한 명이 붙어서 작업을 했다보니 파일을 다시 통합할 필요가 있었습니다. # 페이지별 데이터셋 불러오기 total_1 = pd.read_csv("N:/개인/DA/Python/크롤링/final_project/after_cleansing/통합본/total_1_after..