전체 글(152)
-
판다스 복습 계속.
변수를 안쓰고 사용하는 법을 해봤는데 반은 이해가 안되는 부분이다. 위 코드는 변수 선언을 통해 데이터 프레임을 한 번 만들고 그 다음에 ['points']>=95를 하여 다시 데이터 프레임으로 만들도록 인덱스 연산을 한 것이다. 반면 아래 코드는 and(&)로 묶여있다. 변수 선언을 하지 않았기 때문에 데이터 프레임이 아직 생성되지 않았으므로 &로 묶어준다. 또 isin([])을 사용해서 여러 개의 컬럼 인덱스를 조건으로 넣을 수도 있다. isin을 기억하자. df1 = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Jane'], 'Age': [25, 30, 35, 40], 'Sex': ['Man', 'Woman', 'Man', 'Woman'],} ) # sele..
2023.05.27 -
비전공자 전문대 졸업자는 인공지능 배워서 어디로 취업할 수 있을까? 나는 무엇을 공부해야 할까.
나는 석박 출신이 아니다. 2년제 대학을 다녔고 물경력에 이제 막 파이썬을 배우고 여러 라이브러리를 얼기설기 따라하고 있다. 내가 나중에 수료하면 아무튼 나도 취업을 해야 하는데, 과연 우리나라의 데이터 사이언티스트는 어떻고 나는 어떤 것을 알아야 하고 어떤 일을 하고, 준비해야 하는지 알아보기 위해 유튜브에 검색을 해봤다. 그런데 데이터 사이언티스트라고 쳐보니 하지마세요!? ㅋㅋㅋㅋㅋ 아니 아직 1달도 안됐는데 하지 말라고? 함정에 빠진 것인가? 안들어갈 수가 없었다. 굉장한 키워드다.. 그 중 맨 위에 있는 우리나라 사람이 올린 영상을 봤다. https://www.youtube.com/watch?v=8mjeJpHtLVQ 우선 썸네일에 좀 마음이 흔들리긴 했는데, 요약하면 데이터 사이언티스트의 일이 그..
2023.05.26 -
경기도미래기술학교 AI개발자 부트캠프 15일차 TIL - 판다스 문제들을 풀어본 날.
오늘은 어제 얼기설기 배운 판다스를 예제와 함께 풀어본 날이었다. isnull().sum()을 했는데 isnull()로 하면 결측된 애들과 아닌 애들을 각 요소에 boolean 타입으로 리턴해서 보여준다. sum()을 하면 isnull()이 True인 애들만 더해서 보여준다. 문법적으로 생소하긴 하다. 첫번 째는 row, 두번 째는 column이다. 그런데 그 각각을 리스트 타입으로 묶은 뒤 다시 리스트로 감싸야 한다. 리스트 타입으로 묶어서 그 행과 열에 해당하는 데이터 프레임을 반환하는 것이다. 대신 마지막을 또 묶어줘야 하나의 큰 데이터 프레임으로 인식하는 것이다. 얘도 마찬가지. 여기서 이해가 좀 잘됐던게 [] 이게 판다스에서는 인덱싱 연산자 라고 말한다는 것이다. df['country'] == ..
2023.05.26 -
경기도미래기술학교 AI개발자 부트캠프 14일차 TIL - pandas를 배운날.
오늘은 본격적으로 판다스 문법을 배웠다. 이것을 잘 배워야 데이터 전처리도 잘하고 나중에 도형도 내가 원하는대로 보일 수 있을 것이다. 먼저 느낀 평가는 엑셀이랑 데이터베이스랑 비슷한 느낌이 들었다. 그리고 엑셀 파일 가공을 소스로 해결할 수 있다는게 굉장한 장점으로 다가왔다. titanic_df = pd.read_csv('/content/titanic.csv') #df(dataFrame) titanic_df.head() # 처음부터 5건 출력 read_csv라는 메소드는 csv 파일을 불러오는데 사용된다. head()는 데이터 프레임의 첫 부분을 확인하는 데 쓴다. n개의 행을 반환할 수 있다. import os import pandas as pd ROOT_DIR = '/content' #df는 데이터..
2023.05.25 -
인공지능 교육을 배울 때 유념해야 할 자세.
이 사이트를 참고하면 된다. 나는 아직 파이썬만 배웠고 아무것도 모르니까. https://www.youtube.com/watch?v=m6-4h2odSJc 파이썬은 단지 도구를 배웠을 뿐이고 그것을 다루는 도구는 아직 배우지 않았다. 그러니 너무 조급해하지 말자. NumPy, Pandas, 맷플롯립 NumPy : 통계치 연산, 통계 연산 가능하다. Pandas : 데이터 프레임(엑셀 처럼) 가공이 가능하다. 서로 다른 형태의 테이블을 합치거나 데이터의 형변화 맷플롯립 : 데이터를 시각화 하는 것. 1. 너무 이론적인 것을 보지 말고 실습 위주, 코드 위주로 보자. 2. 책으로 배운 지식을 실전에 적용 시키는 것. 3. 케글이 좋다. (타이타닉 생존자 예측으로 보통 시작) https://www.youtube..
2023.05.25 -
경기도미래기술학교 AI개발자 부트캠프 13일차 TIL - 크롤링, 네이버 OPEN API 하는법, 크롬 브라우저에서 Selenium을 했다.
import requests from bs4 import BeautifulSoup html = driver.page_source #페이지소스를 html 변수에 넣음 soup = BeautifulSoup(html,'lxml') # html을 파싱 #content > div.style_content__xWg5l > div.basicList_list_basis__uNBZx > div > div:nth-child(1) > div > div > div.basicList_info_area__TWvzp > div.basicList_title__VfX3c > a onetitle = soup.select_one('#content > div.style_content__xWg5l > div.basicList_list_bas..
2023.05.24