경기도청년지원(29)
-
경기도미래기술학교 AI개발자 부트캠프 20일차 TIL- Numpy를 배운날. Numpy란? ndarray ,reshape
Numpy를 배웠다. 오늘 배운 것은 Pandas에서 개념이 좀 추가된 느낌이여서.. 우선 천천히 정리를 해보자. Numpy란? Numerical Python의 약자로 Numerical은 숫자/수치적인 이라는 의미이다. 뭔가 계산적인 것과 관련된 것을 하는 라이브러리임을 암시한다. 실제로 Numpy는 배열, 선형 대수, 통계 등의 수치 계산 작업을 효율적으로 처리하기 위해 개발되었다. ndarray란 n차원 배열을 나타내는 용어이다. n-Dimensional의 약어이다. 3차원 배열을 처음 만들어봤다. 3차원 배열은 row, column, depth(channel)이라고 부른다고 하는데 사람들마다 좀 다르게 부르나 보다. 4차원까지 가면 time이나 batch라고 부른다고 한다. ndarray도 [] 이..
2023.06.05 -
경기도미래기술학교 AI개발자 부트캠프 19일차 TIL- 써먹을 matplotlib과 헷갈렸던 것 정리.
import matplotlib.pyplot as plt plt.scatter([0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5]) plt.title('산점도') plt.xlabel('키') plt.ylabel('몸무게') # plt.grid(True) plt.show() plt.grid(True)는 격자가 보인다. 안했을 때와 했을 때 bk_df1['대여소번호'] = bk_df1['대여소번호'].astype(object) 대여소번호 라는 컬럼을 object형으로 변환하는 코드이다. notna()와 isnull()의 차이. isnull() 메서드는 누락된 값이면 해당 위치에 True를 반환한다. 그렇지 않을 때는 False를 반환한다. notna() 메서드는 누락된 값이 아닐 때 해당위..
2023.06.04 -
경기도미래기술학교 AI개발자 부트캠프 17일차 TIL- WordCloud란 무엇인가? 하는법.
워드 클라우드란 무엇인가? 이거다. 키워드 간 관계는 없으나 빈도 수를 기준으로 단어들을 표현하는 방식이다. 단어의 크기가 클 수록 빈도수가 많다는 의미이다. 자연어 처리나 텍스트 마이닝, SNS 글 분석 등에 주로 사용 된다. 우리는 한국어 자연어 처리를 위해서 KONLPy(코 앤엘 파이)라는 라이브러리를 사용했다. 설치방법은 따로 배워야 한다. 설치가 끝나면 import konlpy konlpy.__version__ 이 코드로 버전 확인이 가능하다. 문장, 명사, 형태소 추출이다. 꼬꼬마라는 모듈의 sentences,nouns,morphs 메소드이다. wget을 사용해서 텍스트를 다운받고 워드클라우드를 진행했다. WordCloud에 generate()라는 메서드를 사용하여 텍스트 데이터를 사용한다...
2023.05.31 -
경기도미래기술학교 AI개발자 부트캠프 16일차 TIL - 데이터 시각화. matplotlib, pyplot, seaborn.
벌써 4주차다. 거의 한달 차라는 이야기인데, 딱히 발전한 것이 있는지는 잘 모르겠다.. 파이썬은 얼기설기 배워서 좀 더 단단해진 것 같기도 하고.. 데이터 프레임을 배웠고.. 근데 데이터프레임도 완벽하게 아는 것은 아니고. 아무튼 계속 반복하면서 배워야 하는 부분. matplotlib : 파이썬에서 데이터를 시각화하기 위한 라이브러리. pyplot : matplotlib의 하위 모듈로 시각화를 지원한다. matplotlib에서는 이 외에도 patches, figure 등 다양한 모듈이 있는데 나는 그중에서 pyplot을 배운 것. 다시 한 번 상기하는 내장함수, 메서드, 모듈, 라이브러리의 차이를 읽자. 라이브러리(Library): 라이브러리는 재사용 가능한 코드의 집합이며, 특정 기능을 제공하는 함수..
2023.05.30 -
경기도미래기술학교 AI개발자 부트캠프 2일차 TIL : 통계학 엑셀실습.
오늘 시작은 철광석 중 어떤 것이 가격변동이 적은지에 대한 테스트를 진행했다. 가격 변동성이 적은 것을 구할 때는 데이터의 분산 혹은 표준 편차를 확인해야 한다. 복습도 좀 하자. 분산 : 각 데이터 값과 평균값의 차이를 제곱한 값의 평균. 표준편차 : 분산의 제곱근. 따라서 분산과 표준편차가 작으면 데이터가 중심에 모여 있으며, 변동이 적다는 것을 의미한다. 우선 철스크랩 표준 편차는 약 70, 분산은 5020 열연의 표준 편차는 약 91, 분산은 8326 냉연의 표준 편차는 131, 분산은 17176 따라서 철스크랩의 편차가 가장 작은 값을 나타냈기 때문에 철스크랩의 가격 변동성이 가장 적다는 결론을 냈다. 또 직접적인 경우는 아니지만 가격 변동이 큰 상품인 경우는 왜도가 큰 값이 나타날 수 있고 데..
2023.05.09