일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 전처리
- streamlit
- Chat GPT
- jd
- If
- cross join
- GA4
- 기초통계
- 팀프로젝트
- 히트맵
- 클러스터링
- 프롬프트 엔지니어링
- Python
- data analyst
- SQLD
- da
- 크롤링
- 데이터분석
- 태블로
- 군집화
- 머신러닝
- pandas
- lambda
- 데이터 분석
- 시각화
- 서브쿼리
- 프로젝트
- 최종 프로젝트
- SQL
- 기초프로젝트
- Today
- Total
목록전체 글 (328)
세조목
금일은 기초 프로젝트가 시작되는 날이었습니다. 미니 프로젝트의 경우 거의 지식없이 수행했던 프로젝트라 '이제 시작입니다.'라는 것을 알려주는 하나의 행사같은 느낌이었다면 이번 기초 프로젝트의 경우 캠프가 시작되고서 3주가 지난 뒤에 진행되는 프로젝트다보니 SQL, PYTHON, 데이터 리터러시, 알고리즘에 대한 지식이 어느정도는 쌓여있어서 미니 프로젝트보다는 틀이 잡힌 결과물이 나오지 않을까하는 생각이 들었습니다. (미니 프로젝트 관련 영상은 아래 링크를 참고) https://youtu.be/HVmAdD1d4bE?si=hVJUbRBMFVinRtfe 팀스파르타에서도 미니프로젝트때는 없던 조건(?)들을 두가지 제시했는데요, 조건은 다음과 같았습니다. SQL을 메인으로 활용해야했으며 JOIN 기능을 활용해야하..
원하는 값을 출력하기위해 쿼리문을 작성하고서 결과값을 export해야할 때가 있다. 내가 알고있는 방법은 두가지인데 첫번째 방법 1. 결과테이블을 우클릭하면 '데이터 추출'이 보인다. 2. '데이터 추출'을 클릭했을때 나오는 화면이다. 여기서 원하는 파일 유형을 선택하고 '다음'을 누른다. 3. 여기서는 크게 중요한 것 없으니 그대로 '다음'을 클릭한다. 4. 다음 페이지 역시도 크게 손댈 것 없으니 그대로 '다음'을 눌러준다. 5. 여기서는 위 이미지의 빨간색 부분을 수정이 필요하다면 수정해줘야한다. 'Directory'는 파일이 저장될 경로로 경로 변경이 필요한 사람은 수정해준다. 'File name pattern'은 파일이 저장될때 어떤 패턴으로 파일이름이 저장될 것인지를 나타내는데 저장하고싶은 특..
DBeaver를 사용해서 MySql에 연결하고있다. 기본 프로젝트를 진행하며 csv파일을 불러오려고하는데 아래와 같은 오류 메시지가 떴다. SQL Error [1046] [3D000]: No database selected 이 오류 메시지는 적혀있는 그대로 데이터베이스에 연결되어있지 않음에 따라 출력되는 것이다. 해결방법은? 간단하다. 데이터 베이스에 연결해주면 된다. 일단 현재 내 계정에 어떤 db들이 있는지 먼저 확인해야하기때문에 show databases; 를 입력해서 db를 확인해준다. 그런 다음 use basicproject; 를 입력해주면 db 등록이 완료되며 select * from (테이블명) 을 입력하면 정상적으로 테이블이 출력되는 것을 확인할 수 있다.
2024.01.10 - [데이터 분석 공부/Python] - PYTHON 정리(원하는 row만 제거, 컬럼 순서 바꾸기)(24.01.10) PYTHON 정리(개인과제 오답 풀이)(24.01.10) Python 개인과제 오답 풀이 Q.2 # 출제자의 의도 1. 문자열 처리방법을 알아내고, 메소드를 활용 ● str.split 2. domain에 .이 있는 것을 확인하는 방법 ● in 3. 문제 설명에 따르면 .com도 옳은 도메인으로 eyeoftheworld1209.tistory.com 2024.01.10 - [데이터 분석 공부/Python] - PYTHON 정리(개인과제 오답 풀이)(24.01.10) PYTHON 정리(개인과제 오답 풀이)(24.01.10) Python 개인과제 오답 풀이 Q.2 # 출제자..
1. 원하는 row만 제거 pandas 라이브러리를 사용하여 데이터를 분석할때 내가 원하는 row만 제거하고싶다면 필터를 적용하는 것이 방법이 될 수 있다. 변수 = 테이블명['컬럼명'] =='제거하고싶은 속성값' 을 작성한 후 테이블명.drop(index=테이블명[변수].index) 를 해주면 된다. 예를 들어 아래와 같은 테이블이 있다고했을때 '행정구역별(시군구)'의 값이 '동부', '읍부', '면부'인 행은 지우고 싶다면('동부', '읍부', '면부'는 5행~331행 사이에 有) d = people['행정구역별(시군구)'] == '동부' u = people['행정구역별(시군구)'] == '읍부' m = people['행정구역별(시군구)'] == '면부' people = people.drop(inde..
Python 개인과제 오답 풀이 Q.2 # 출제자의 의도 1. 문자열 처리방법을 알아내고, 메소드를 활용 ● str.split 2. domain에 .이 있는 것을 확인하는 방법 ● in 3. 문제 설명에 따르면 .com도 옳은 도메인으로 판단 4. (Advanced)re모듈의 정규표현식을 이용해 판단할수도 있다. email_list = [ "example@example.com", "wrongemail@.com", "anotherexample.com", "correct@email.co.uk" ] for email in email_list: split_list = email.split('@') if len(split_list) == 1: print(f'{email}은 유효하지 않은 이메일입니다.') else..
알고리즘 2024.01.09 - [데이터 분석 공부/알고리즘] - 알고리즘(24.01.08) 알고리즘(24.01.08) 알고리즘이란? 입력된 값이 단계적 절차를 거쳐서 결과값으로 반환되는 것을 알고리즘이라고 한다. 알고리즘이 프로그래밍 능력을 평가하기에 가장 좋다고한다. 알고리즘 문제는 프로그래밍 eyeoftheworld1209.tistory.com 금일은 어제부터 시작된 알고리즘 특강의 마지막 날이었습니다. 시간 관계상 자세하게는 아니었지만 자료구조와 알고리즘의 개념에 대해서 한번 훑을 수 있는 기회였습니다. 알고리즘을 생각하는 과정이 생각보다 재밌어서 지금보다 조금 더 여유가 생겼을때 별도로 알고리즘을 공부해볼까하는 생각도 들었습니다.
알고리즘이란? 입력된 값이 단계적 절차를 거쳐서 결과값으로 반환되는 것을 알고리즘이라고 한다. 알고리즘이 프로그래밍 능력을 평가하기에 가장 좋다고한다. 알고리즘 문제는 프로그래밍 능력을 정량화할 수 있기때문이다. 데이터 분석가들이 왜 프로그래밍을 공부해야할까? 위 이미지 속 예시에서처럼 데이터가 DB에 적재되어있지 않을 경우 적재를 요청해야하는 경우가 있다. 이 때 개발자가 해당 업무를 처리해주길 무한정 기다릴수만은 없다. 평소에 개발 공부를 해놓았다면 데이터와 관련된 작업들은 일정 수준 혼자서 수행 가능할 것이다. 물론 SQL을 활용해서 데이터 추출하고 분석하는 것만해도 회사에서 1인분은 할 것이다. 하지만 알고리즘에 대한 이해를 바탕으로 프로그래밍을 할 수 있다면 분석 프로세스에서 내가 할 수 있는 ..
JD(Job Description) https://eyeoftheworld1209.tistory.com/entry/JDJob-Description%EA%B8%88%EC%9C%B5240108 PYTHON https://eyeoftheworld1209.tistory.com/entry/PYTHON-%EC%A0%95%EB%A6%AC%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%ED%81%90-%EC%98%88%EC%A0%9C240108 금일은 한 달 정도만에 JD(Job Description)을 수행했습니다. 튜터님과의 상담이 예정되어있었기때문인데요,. 경영학과 출신, 채권관리 경력이 있는 저이기에 금융권 취업을 생각해보지 않을수가 없었습니다. 그래서 금융권에 몸 담고 계시는 튜터님과 금일..
1. 프로그래머스 PYTHON 예제 '나누어 떨어지는 숫자 배열' https://school.programmers.co.kr/learn/courses/30/lessons/12910 '나누어 떨어지는 수자 배열' 문제의 요구사항을 정리하면 다음과 같다. array의 각 element 중 divisor로 나누어 떨어지는 값을 구하라 오름차순으로 정렬해라 divisor로 나누어 떨어지는 element가 하나도 없다면 배열에 -1을 담아서 반환해라 일전에 이 문제를 풀었던 적이 있었다. 그 때 아래 부분까지는 코드를 작성했다. def solution(arr, divisor): answer = [] for num in arr: if num % divisor == 0: answer.append(num) answer..