경기도무료교육(26)
-
경기도미래기술학교 AI개발자 부트캠프 21일차 TIL- 회귀분석, t분포 등 통계지식 배우기. 통계는 분산의 마법.
https://eastjin.tistory.com/72 경기도미래기술학교 AI개발자 부트캠프 1일차 TIL : 파워쿼리, 엑셀 실습. 통계학의 기본 개념. 실습과제는 엑셀을 활용한 파워쿼리라는 것을 배웠다. 함께한 주제는 이것이다. 요즘 TV에 트로트가 참 많이 나오는데 과연 다른 장르의 곡들에 비해 인기가 많을까? 라는 논제이다. 멜론의 좋아 eastjin.tistory.com 예전에 적었던 것. 표준편차 : 분산의 제곱근. 데이터가 평균값으로부터 얼마나 떨어져있는지 나타낸다. 분산 : 데이터가 얼마나 분산되어있는지를 나타내는 값. 각 편차의 제곱을 하여 나눈다. https://www.youtube.com/watch?v=5Xke4ao1g9E&list=TLPQMDcwNjIwMjMfgrSYW1RkKw&in..
2023.06.08 -
경기도미래기술학교 AI개발자 부트캠프 20일차 TIL- Numpy를 배운날. Numpy란? ndarray ,reshape
Numpy를 배웠다. 오늘 배운 것은 Pandas에서 개념이 좀 추가된 느낌이여서.. 우선 천천히 정리를 해보자. Numpy란? Numerical Python의 약자로 Numerical은 숫자/수치적인 이라는 의미이다. 뭔가 계산적인 것과 관련된 것을 하는 라이브러리임을 암시한다. 실제로 Numpy는 배열, 선형 대수, 통계 등의 수치 계산 작업을 효율적으로 처리하기 위해 개발되었다. ndarray란 n차원 배열을 나타내는 용어이다. n-Dimensional의 약어이다. 3차원 배열을 처음 만들어봤다. 3차원 배열은 row, column, depth(channel)이라고 부른다고 하는데 사람들마다 좀 다르게 부르나 보다. 4차원까지 가면 time이나 batch라고 부른다고 한다. ndarray도 [] 이..
2023.06.05 -
경기도미래기술학교 AI개발자 부트캠프 19일차 TIL- 써먹을 matplotlib과 헷갈렸던 것 정리.
import matplotlib.pyplot as plt plt.scatter([0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5]) plt.title('산점도') plt.xlabel('키') plt.ylabel('몸무게') # plt.grid(True) plt.show() plt.grid(True)는 격자가 보인다. 안했을 때와 했을 때 bk_df1['대여소번호'] = bk_df1['대여소번호'].astype(object) 대여소번호 라는 컬럼을 object형으로 변환하는 코드이다. notna()와 isnull()의 차이. isnull() 메서드는 누락된 값이면 해당 위치에 True를 반환한다. 그렇지 않을 때는 False를 반환한다. notna() 메서드는 누락된 값이 아닐 때 해당위..
2023.06.04 -
경기도미래기술학교 AI개발자 부트캠프 17일차 TIL- WordCloud란 무엇인가? 하는법.
워드 클라우드란 무엇인가? 이거다. 키워드 간 관계는 없으나 빈도 수를 기준으로 단어들을 표현하는 방식이다. 단어의 크기가 클 수록 빈도수가 많다는 의미이다. 자연어 처리나 텍스트 마이닝, SNS 글 분석 등에 주로 사용 된다. 우리는 한국어 자연어 처리를 위해서 KONLPy(코 앤엘 파이)라는 라이브러리를 사용했다. 설치방법은 따로 배워야 한다. 설치가 끝나면 import konlpy konlpy.__version__ 이 코드로 버전 확인이 가능하다. 문장, 명사, 형태소 추출이다. 꼬꼬마라는 모듈의 sentences,nouns,morphs 메소드이다. wget을 사용해서 텍스트를 다운받고 워드클라우드를 진행했다. WordCloud에 generate()라는 메서드를 사용하여 텍스트 데이터를 사용한다...
2023.05.31 -
경기도미래기술학교 AI개발자 부트캠프 16일차 TIL - 데이터 시각화. matplotlib, pyplot, seaborn.
벌써 4주차다. 거의 한달 차라는 이야기인데, 딱히 발전한 것이 있는지는 잘 모르겠다.. 파이썬은 얼기설기 배워서 좀 더 단단해진 것 같기도 하고.. 데이터 프레임을 배웠고.. 근데 데이터프레임도 완벽하게 아는 것은 아니고. 아무튼 계속 반복하면서 배워야 하는 부분. matplotlib : 파이썬에서 데이터를 시각화하기 위한 라이브러리. pyplot : matplotlib의 하위 모듈로 시각화를 지원한다. matplotlib에서는 이 외에도 patches, figure 등 다양한 모듈이 있는데 나는 그중에서 pyplot을 배운 것. 다시 한 번 상기하는 내장함수, 메서드, 모듈, 라이브러리의 차이를 읽자. 라이브러리(Library): 라이브러리는 재사용 가능한 코드의 집합이며, 특정 기능을 제공하는 함수..
2023.05.30 -
경기도미래기술학교 AI개발자 부트캠프 7일차 TIL - 딕셔너리, for문에 대해서, 함수
오늘은 딕셔너리에 대해 배웠다. 예전에 자바에서 비슷하게 배운 hashmap 같은 것과 비슷한데 내가 공부를 깊게 안해서 그런가 파이썬은 독특해서 그런가 처음 보는 것도 많고 응용할 것도 많고 신기하다. 천천히 꾸준하게 하자. class_score = {} print(type(class_score)) class_score['Mike'] = 83 class_score['Alice'] = 92 class_score['Tina'] = 79 class_score['Ron'] = 88 print(class_score['Alice']) if "Paul" in class_score: print("Paul 있습니다.") else:print("Paul 없습니다.") 빈 딕셔너리에 key, value 값을 넣고 내가 잘 ..
2023.05.16