에이블런부트캠프(30)
-
경기도미래기술학교 AI개발자 부트캠프 18일차 TIL- 기상정보를 활용한 공공자전거 수요분석
기초도 잘 모르겠고... 해서 오늘은 한 번 샅샅이 파보자. from glob import glob file_names = glob("/content/drive/MyDrive/Colab Notebooks/인공지능 개발자 과정/탐색적데이터분석/따릉이데이터/*.csv") file_names glob은 파이썬 내장모듈이다. 파일 경로명을 사용해 마일 목록을 검색한다. 위의 코드는 from을 썼기 때문에 glob()을 바로 쓸 수 있고 쓰지 않는다면 glob.glob() 이렇게 할 것이다. 그렇게 해서 매개변수에 경로를 넣고 *.csv를 했기 때문에 해당 경로에 있는 csv로 저장된 확장자들을 모두 찾아서 file_names에 list로 넣을 것이다...
2023.06.02 -
경기도미래기술학교 AI개발자 부트캠프 17일차 TIL- WordCloud란 무엇인가? 하는법.
워드 클라우드란 무엇인가? 이거다. 키워드 간 관계는 없으나 빈도 수를 기준으로 단어들을 표현하는 방식이다. 단어의 크기가 클 수록 빈도수가 많다는 의미이다. 자연어 처리나 텍스트 마이닝, SNS 글 분석 등에 주로 사용 된다. 우리는 한국어 자연어 처리를 위해서 KONLPy(코 앤엘 파이)라는 라이브러리를 사용했다. 설치방법은 따로 배워야 한다. 설치가 끝나면 import konlpy konlpy.__version__ 이 코드로 버전 확인이 가능하다. 문장, 명사, 형태소 추출이다. 꼬꼬마라는 모듈의 sentences,nouns,morphs 메소드이다. wget을 사용해서 텍스트를 다운받고 워드클라우드를 진행했다. WordCloud에 generate()라는 메서드를 사용하여 텍스트 데이터를 사용한다...
2023.05.31 -
경기도미래기술학교 AI개발자 부트캠프 11일차 TIL - 크롤링
크롤링은 예전에 한 번 해봤는데 진짜 금방 까먹는다. 참. 뭔가 기억이 날 듯 말 듯. 처음 보는 것처럼도 보이고 ㅎㅎ 파이참이 자꾸 안돼서 정신이 없어서 집중을 잘 못했다. 한스럽다. 하기 전에, JsonView 같이 Json을 편하게 보여주는 크롬 확장 프로그램이 있으니 마음에 드는 것을 찾아서 설치하자. 우선 크롤링을 하기 위해서 사이트가 잘 되는지 확인하기 위해 requests 라는 라이브러리를 사용한다. requesets는 HTTP 통신의 요청과 응답를 하는데 도움을 주는 라이브러리이다. import requests response = requests.get("http://example.com") print(response) print(response.text) 이렇게 해서 response를 ..
2023.05.22 -
경기도미래기술학교 AI개발자 부트캠프 10일차 TIL - 클래스 만들기 self는 뭘까. 속성과 메소드.
클래스 만들기에서 좀 헷갈렸던게 self다. 일반적으로 함수 정의했을 때랑 클래스 안에서 함수 정의했을 때를 헷갈리지 말자. 다르다. #self는 현재 인스턴스 자신을 참조하는 데 사용. #해당 인스턴스의 속성에 접근하고 메서드를 호출하는 데 사용. class Person2: def greeting(self): print('Hello') def hello(self): self.greeting() eastjin = Person2() eastjin.hello() self는 사용한 적이 없는데 대체 어디서 튀어나온걸까. 일단 기본적으로 self라는 것 하나는 적어야 한다. class 함수같은 경우는 호출하면 기본값으로 하나의 매개변수가 가기 때문이다. 1. eastjin = Person2()라는 것으로 객체를..
2023.05.19 -
경기도미래기술학교 AI개발자 부트캠프 4일차 TIL - 타입 가공하기.
예전에 공부를 깔짝깔짝 했더니 역시 모르는 것들이 많이 나왔다. 우선 슬라이싱. start,stop,step이 있다. test = 'Hello Python' reverse = test[::-1] print(reverse) nohtyP olleH 이렇게 나온다. 끝에서부터 출력하는 방식이다. 희한하다. 끝에서부터 찍는다니. 그리고 부동소수점을 찍을 때는 :.5f 이런 식으로 소숫점 표시할 자리까지 찍으면 된다. 제곱근은 math 라는 모듈을 임포트 해서 sqrt를 가져와야 한다. math라는 모듈이 있다. import math radius = 3 #pi : 파이. 메스 모듈 안에 이미 정의되어 있는 메소드더라. #pow : r의 제곱을 표현 area = math.pi * math.pow(radius,2)..
2023.05.11 -
경기도미래기술학교 AI개발자 부트캠프 2일차 TIL : 통계학 엑셀실습.
오늘 시작은 철광석 중 어떤 것이 가격변동이 적은지에 대한 테스트를 진행했다. 가격 변동성이 적은 것을 구할 때는 데이터의 분산 혹은 표준 편차를 확인해야 한다. 복습도 좀 하자. 분산 : 각 데이터 값과 평균값의 차이를 제곱한 값의 평균. 표준편차 : 분산의 제곱근. 따라서 분산과 표준편차가 작으면 데이터가 중심에 모여 있으며, 변동이 적다는 것을 의미한다. 우선 철스크랩 표준 편차는 약 70, 분산은 5020 열연의 표준 편차는 약 91, 분산은 8326 냉연의 표준 편차는 131, 분산은 17176 따라서 철스크랩의 편차가 가장 작은 값을 나타냈기 때문에 철스크랩의 가격 변동성이 가장 적다는 결론을 냈다. 또 직접적인 경우는 아니지만 가격 변동이 큰 상품인 경우는 왜도가 큰 값이 나타날 수 있고 데..
2023.05.09