부트캠프TIL(29)
-
경기도미래기술학교 AI개발자 부트캠프 22일차 TIL- 미니 프로젝트(1) - 주제 정하기: 인구감소. 가설 정하고 데이터 구하기.
오늘은 공부시간이 별로 안되어서 조금만 씀. 미니 프로젝트 주간이다. 나는 인구감소에 대한 원인들을 모으고 그 원인들이 상관관계가 어떻게 되어있는지 분석해보기로 했다. 시작하기 전에 목표를 가지고 가자. 목표를 먼저 적어야 나중에 덜 헤맬 것 같다. 내 목표. 1. pandas와 matplotlib을 전보다 더 숙련되게 사용하는 것. 앞으로도 많이 사용할 것들이기 때문이다. 2. 나만의 결론을 도출하기. 대신 너무 깊게 가지 말기. 우선 출산율 감소에 대한 대표적인 원인들을 분석해보고 내가 생각하는 추론을 세운 뒤, 대한민국은 어떻게 발전해야 하는지 나만의 결론을 꺼내보자. 우선! 시작이 반이다. 코랩 파일을 만들고 수업시간에 배웠던 한글깨짐 테스트를 진행하였다. # colab에서 한글폰트 사용하기 # ..
2023.06.09 -
경기도미래기술학교 AI개발자 부트캠프 21일차 TIL- 회귀분석, t분포 등 통계지식 배우기. 통계는 분산의 마법.
https://eastjin.tistory.com/72 경기도미래기술학교 AI개발자 부트캠프 1일차 TIL : 파워쿼리, 엑셀 실습. 통계학의 기본 개념. 실습과제는 엑셀을 활용한 파워쿼리라는 것을 배웠다. 함께한 주제는 이것이다. 요즘 TV에 트로트가 참 많이 나오는데 과연 다른 장르의 곡들에 비해 인기가 많을까? 라는 논제이다. 멜론의 좋아 eastjin.tistory.com 예전에 적었던 것. 표준편차 : 분산의 제곱근. 데이터가 평균값으로부터 얼마나 떨어져있는지 나타낸다. 분산 : 데이터가 얼마나 분산되어있는지를 나타내는 값. 각 편차의 제곱을 하여 나눈다. https://www.youtube.com/watch?v=5Xke4ao1g9E&list=TLPQMDcwNjIwMjMfgrSYW1RkKw&in..
2023.06.08 -
경기도미래기술학교 AI개발자 부트캠프 19일차 TIL- 써먹을 matplotlib과 헷갈렸던 것 정리.
import matplotlib.pyplot as plt plt.scatter([0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5]) plt.title('산점도') plt.xlabel('키') plt.ylabel('몸무게') # plt.grid(True) plt.show() plt.grid(True)는 격자가 보인다. 안했을 때와 했을 때 bk_df1['대여소번호'] = bk_df1['대여소번호'].astype(object) 대여소번호 라는 컬럼을 object형으로 변환하는 코드이다. notna()와 isnull()의 차이. isnull() 메서드는 누락된 값이면 해당 위치에 True를 반환한다. 그렇지 않을 때는 False를 반환한다. notna() 메서드는 누락된 값이 아닐 때 해당위..
2023.06.04 -
경기도미래기술학교 AI개발자 부트캠프 18일차 TIL- 기상정보를 활용한 공공자전거 수요분석
기초도 잘 모르겠고... 해서 오늘은 한 번 샅샅이 파보자. from glob import glob file_names = glob("/content/drive/MyDrive/Colab Notebooks/인공지능 개발자 과정/탐색적데이터분석/따릉이데이터/*.csv") file_names glob은 파이썬 내장모듈이다. 파일 경로명을 사용해 마일 목록을 검색한다. 위의 코드는 from을 썼기 때문에 glob()을 바로 쓸 수 있고 쓰지 않는다면 glob.glob() 이렇게 할 것이다. 그렇게 해서 매개변수에 경로를 넣고 *.csv를 했기 때문에 해당 경로에 있는 csv로 저장된 확장자들을 모두 찾아서 file_names에 list로 넣을 것이다...
2023.06.02 -
경기도미래기술학교 AI개발자 부트캠프 16일차 TIL - 데이터 시각화. matplotlib, pyplot, seaborn.
벌써 4주차다. 거의 한달 차라는 이야기인데, 딱히 발전한 것이 있는지는 잘 모르겠다.. 파이썬은 얼기설기 배워서 좀 더 단단해진 것 같기도 하고.. 데이터 프레임을 배웠고.. 근데 데이터프레임도 완벽하게 아는 것은 아니고. 아무튼 계속 반복하면서 배워야 하는 부분. matplotlib : 파이썬에서 데이터를 시각화하기 위한 라이브러리. pyplot : matplotlib의 하위 모듈로 시각화를 지원한다. matplotlib에서는 이 외에도 patches, figure 등 다양한 모듈이 있는데 나는 그중에서 pyplot을 배운 것. 다시 한 번 상기하는 내장함수, 메서드, 모듈, 라이브러리의 차이를 읽자. 라이브러리(Library): 라이브러리는 재사용 가능한 코드의 집합이며, 특정 기능을 제공하는 함수..
2023.05.30 -
경기도미래기술학교 AI개발자 부트캠프 15일차 TIL - 판다스 문제들을 풀어본 날.
오늘은 어제 얼기설기 배운 판다스를 예제와 함께 풀어본 날이었다. isnull().sum()을 했는데 isnull()로 하면 결측된 애들과 아닌 애들을 각 요소에 boolean 타입으로 리턴해서 보여준다. sum()을 하면 isnull()이 True인 애들만 더해서 보여준다. 문법적으로 생소하긴 하다. 첫번 째는 row, 두번 째는 column이다. 그런데 그 각각을 리스트 타입으로 묶은 뒤 다시 리스트로 감싸야 한다. 리스트 타입으로 묶어서 그 행과 열에 해당하는 데이터 프레임을 반환하는 것이다. 대신 마지막을 또 묶어줘야 하나의 큰 데이터 프레임으로 인식하는 것이다. 얘도 마찬가지. 여기서 이해가 좀 잘됐던게 [] 이게 판다스에서는 인덱싱 연산자 라고 말한다는 것이다. df['country'] == ..
2023.05.26