인공지능개발자(41)
-
경기도미래기술학교 AI개발자 부트캠프 22일차 TIL- 미니 프로젝트(1) - 주제 정하기: 인구감소. 가설 정하고 데이터 구하기.
오늘은 공부시간이 별로 안되어서 조금만 씀. 미니 프로젝트 주간이다. 나는 인구감소에 대한 원인들을 모으고 그 원인들이 상관관계가 어떻게 되어있는지 분석해보기로 했다. 시작하기 전에 목표를 가지고 가자. 목표를 먼저 적어야 나중에 덜 헤맬 것 같다. 내 목표. 1. pandas와 matplotlib을 전보다 더 숙련되게 사용하는 것. 앞으로도 많이 사용할 것들이기 때문이다. 2. 나만의 결론을 도출하기. 대신 너무 깊게 가지 말기. 우선 출산율 감소에 대한 대표적인 원인들을 분석해보고 내가 생각하는 추론을 세운 뒤, 대한민국은 어떻게 발전해야 하는지 나만의 결론을 꺼내보자. 우선! 시작이 반이다. 코랩 파일을 만들고 수업시간에 배웠던 한글깨짐 테스트를 진행하였다. # colab에서 한글폰트 사용하기 # ..
2023.06.09 -
경기도미래기술학교 AI개발자 부트캠프 17일차 TIL- WordCloud란 무엇인가? 하는법.
워드 클라우드란 무엇인가? 이거다. 키워드 간 관계는 없으나 빈도 수를 기준으로 단어들을 표현하는 방식이다. 단어의 크기가 클 수록 빈도수가 많다는 의미이다. 자연어 처리나 텍스트 마이닝, SNS 글 분석 등에 주로 사용 된다. 우리는 한국어 자연어 처리를 위해서 KONLPy(코 앤엘 파이)라는 라이브러리를 사용했다. 설치방법은 따로 배워야 한다. 설치가 끝나면 import konlpy konlpy.__version__ 이 코드로 버전 확인이 가능하다. 문장, 명사, 형태소 추출이다. 꼬꼬마라는 모듈의 sentences,nouns,morphs 메소드이다. wget을 사용해서 텍스트를 다운받고 워드클라우드를 진행했다. WordCloud에 generate()라는 메서드를 사용하여 텍스트 데이터를 사용한다...
2023.05.31 -
경기도미래기술학교 AI개발자 부트캠프 16일차 TIL - 데이터 시각화. matplotlib, pyplot, seaborn.
벌써 4주차다. 거의 한달 차라는 이야기인데, 딱히 발전한 것이 있는지는 잘 모르겠다.. 파이썬은 얼기설기 배워서 좀 더 단단해진 것 같기도 하고.. 데이터 프레임을 배웠고.. 근데 데이터프레임도 완벽하게 아는 것은 아니고. 아무튼 계속 반복하면서 배워야 하는 부분. matplotlib : 파이썬에서 데이터를 시각화하기 위한 라이브러리. pyplot : matplotlib의 하위 모듈로 시각화를 지원한다. matplotlib에서는 이 외에도 patches, figure 등 다양한 모듈이 있는데 나는 그중에서 pyplot을 배운 것. 다시 한 번 상기하는 내장함수, 메서드, 모듈, 라이브러리의 차이를 읽자. 라이브러리(Library): 라이브러리는 재사용 가능한 코드의 집합이며, 특정 기능을 제공하는 함수..
2023.05.30 -
경기도미래기술학교 AI개발자 부트캠프 15일차 TIL - 판다스 문제들을 풀어본 날.
오늘은 어제 얼기설기 배운 판다스를 예제와 함께 풀어본 날이었다. isnull().sum()을 했는데 isnull()로 하면 결측된 애들과 아닌 애들을 각 요소에 boolean 타입으로 리턴해서 보여준다. sum()을 하면 isnull()이 True인 애들만 더해서 보여준다. 문법적으로 생소하긴 하다. 첫번 째는 row, 두번 째는 column이다. 그런데 그 각각을 리스트 타입으로 묶은 뒤 다시 리스트로 감싸야 한다. 리스트 타입으로 묶어서 그 행과 열에 해당하는 데이터 프레임을 반환하는 것이다. 대신 마지막을 또 묶어줘야 하나의 큰 데이터 프레임으로 인식하는 것이다. 얘도 마찬가지. 여기서 이해가 좀 잘됐던게 [] 이게 판다스에서는 인덱싱 연산자 라고 말한다는 것이다. df['country'] == ..
2023.05.26 -
경기도미래기술학교 AI개발자 부트캠프 14일차 TIL - pandas를 배운날.
오늘은 본격적으로 판다스 문법을 배웠다. 이것을 잘 배워야 데이터 전처리도 잘하고 나중에 도형도 내가 원하는대로 보일 수 있을 것이다. 먼저 느낀 평가는 엑셀이랑 데이터베이스랑 비슷한 느낌이 들었다. 그리고 엑셀 파일 가공을 소스로 해결할 수 있다는게 굉장한 장점으로 다가왔다. titanic_df = pd.read_csv('/content/titanic.csv') #df(dataFrame) titanic_df.head() # 처음부터 5건 출력 read_csv라는 메소드는 csv 파일을 불러오는데 사용된다. head()는 데이터 프레임의 첫 부분을 확인하는 데 쓴다. n개의 행을 반환할 수 있다. import os import pandas as pd ROOT_DIR = '/content' #df는 데이터..
2023.05.25 -
경기도미래기술학교 AI개발자 부트캠프 12일차 TIL - 크롤링, 네이버 OPEN API 하는법, 크롬 브라우저에서 Selenium을 했다.
참 재미있는 기능들을 했다. 우선 모르는 것좀 정리하면서 이야기 하겠다. xmltodic : 파이썬에서 xml을 dic형으로 바꿔주는 라이브러리이다. gpt의 코드 예제로 보면 다음과 같다. Python Programming John Doe 2022 #to { 'book': { 'title': 'Python Programming', 'author': 'John Doe', 'year': '2022' } } 이렇게 바꿔주는 것이다. pip는 파이썬 패키지 인스톨러 for 파이썬. 파이썬 패키지 관리자로 패키지나 모듈을 설치하고 관리하는 데 사용된다. 그리고 네이버 오픈 API. 먼저 내 어플리케이션 등록을 하고 검색 기능을 사용해보기로 했다. 클라이언트 id랑 secret을 입력해야 한다. 파이썬 예제 코드..
2023.05.23