'경기도청년지원' 태그의 글 목록 (5 Page)

경기도미래기술학교 AI개발자 부트캠프 20일차 TIL- Numpy를 배운날. Numpy란? ndarray ,reshape

Numpy를 배웠다. 오늘 배운 것은 Pandas에서 개념이 좀 추가된 느낌이여서.. 우선 천천히 정리를 해보자. Numpy란? Numerical Python의 약자로 Numerical은 숫자/수치적인 이라는 의미이다. 뭔가 계산적인 것과 관련된 것을 하는 라이브러리임을 암시한다. 실제로 Numpy는 배열, 선형 대수, 통계 등의 수치 계산 작업을 효율적으로 처리하기 위해 개발되었다. ndarray란 n차원 배열을 나타내는 용어이다. n-Dimensional의 약어이다. 3차원 배열을 처음 만들어봤다. 3차원 배열은 row, column, depth(channel)이라고 부른다고 하는데 사람들마다 좀 다르게 부르나 보다. 4차원까지 가면 time이나 batch라고 부른다고 한다. ndarray도 [] 이..

2023.06.05

경기도미래기술학교 AI개발자 부트캠프 19일차 TIL- 써먹을 matplotlib과 헷갈렸던 것 정리.

import matplotlib.pyplot as plt plt.scatter([0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5]) plt.title('산점도') plt.xlabel('키') plt.ylabel('몸무게') # plt.grid(True) plt.show() plt.grid(True)는 격자가 보인다. 안했을 때와 했을 때 bk_df1['대여소번호'] = bk_df1['대여소번호'].astype(object) 대여소번호 라는 컬럼을 object형으로 변환하는 코드이다. notna()와 isnull()의 차이. isnull() 메서드는 누락된 값이면 해당 위치에 True를 반환한다. 그렇지 않을 때는 False를 반환한다. notna() 메서드는 누락된 값이 아닐 때 해당위..

2023.06.04

경기도미래기술학교 AI개발자 부트캠프 17일차 TIL- WordCloud란 무엇인가? 하는법.

워드 클라우드란 무엇인가? 이거다. 키워드 간 관계는 없으나 빈도 수를 기준으로 단어들을 표현하는 방식이다. 단어의 크기가 클 수록 빈도수가 많다는 의미이다. 자연어 처리나 텍스트 마이닝, SNS 글 분석 등에 주로 사용 된다. 우리는 한국어 자연어 처리를 위해서 KONLPy(코 앤엘 파이)라는 라이브러리를 사용했다. 설치방법은 따로 배워야 한다. 설치가 끝나면 import konlpy konlpy.__version__ 이 코드로 버전 확인이 가능하다. 문장, 명사, 형태소 추출이다. 꼬꼬마라는 모듈의 sentences,nouns,morphs 메소드이다. wget을 사용해서 텍스트를 다운받고 워드클라우드를 진행했다. WordCloud에 generate()라는 메서드를 사용하여 텍스트 데이터를 사용한다...

2023.05.31

경기도미래기술학교 AI개발자 부트캠프 16일차 TIL - 데이터 시각화. matplotlib, pyplot, seaborn.

벌써 4주차다. 거의 한달 차라는 이야기인데, 딱히 발전한 것이 있는지는 잘 모르겠다.. 파이썬은 얼기설기 배워서 좀 더 단단해진 것 같기도 하고.. 데이터 프레임을 배웠고.. 근데 데이터프레임도 완벽하게 아는 것은 아니고. 아무튼 계속 반복하면서 배워야 하는 부분. matplotlib : 파이썬에서 데이터를 시각화하기 위한 라이브러리. pyplot : matplotlib의 하위 모듈로 시각화를 지원한다. matplotlib에서는 이 외에도 patches, figure 등 다양한 모듈이 있는데 나는 그중에서 pyplot을 배운 것. 다시 한 번 상기하는 내장함수, 메서드, 모듈, 라이브러리의 차이를 읽자. 라이브러리(Library): 라이브러리는 재사용 가능한 코드의 집합이며, 특정 기능을 제공하는 함수..

2023.05.30

경기도미래기술학교 AI개발자 부트캠프 2일차 TIL : 통계학 엑셀실습.

오늘 시작은 철광석 중 어떤 것이 가격변동이 적은지에 대한 테스트를 진행했다. 가격 변동성이 적은 것을 구할 때는 데이터의 분산 혹은 표준 편차를 확인해야 한다. 복습도 좀 하자. 분산 : 각 데이터 값과 평균값의 차이를 제곱한 값의 평균. 표준편차 : 분산의 제곱근. 따라서 분산과 표준편차가 작으면 데이터가 중심에 모여 있으며, 변동이 적다는 것을 의미한다. 우선 철스크랩 표준 편차는 약 70, 분산은 5020 열연의 표준 편차는 약 91, 분산은 8326 냉연의 표준 편차는 131, 분산은 17176 따라서 철스크랩의 편차가 가장 작은 값을 나타냈기 때문에 철스크랩의 가격 변동성이 가장 적다는 결론을 냈다. 또 직접적인 경우는 아니지만 가격 변동이 큰 상품인 경우는 왜도가 큰 값이 나타날 수 있고 데..

2023.05.09

이스트진 블로그

이스트진 블로그

태그

최근글

댓글

공지사항

아카이브

경기도청년지원(29)

티스토리툴바