에이블런부트캠프(30)
-
경기도미래기술학교 AI개발자 부트캠프 25일차 TIL- 입사지원 포트폴리오와 면접에 관하여.
오늘은 입사지원 기본적인 것과 컨설팅에 대해서 배웠다. 우선 자소서를 잘 써야 한다. 내 장점에 대해 잘 알아야 하기 때문에.. 첫날은 내 성격(장점/단점)을 썼다. 그리고 다음날은 AI면접에 대해서 배웠다. 내가 어떤 사람인지 솔직하게 이야기 해야 한다. 지금의 AI는 스크립트가 있다고 한다. 처음에 말했던 내용과 나중에 말했던 내용에 모순이 있으면 안되기 때문이다. 1분 자기소개서를 작성했다. 또 뭔가 곤란한 질문 케이스를 많이 말해주셨다. 나에게 맞다고 생각하는 색깔은? 맡았던 것 중 가장 흥미로웠던 프로젝트는 무엇이었는가. 직무질문. 빅데이터와 스몰데이터의 차이점이란? Strping MVC의 흐름은 무엇일까. 외국어는 할거면 오픽이나 토익스피킹이나 토익 중에 하나를 하자.
2023.06.13 -
경기도미래기술학교 AI개발자 부트캠프 23일차 TIL- 통계학 복습 계속.
? 분산과 표준편차는 왜 다를까. 분산은 평균으로부터 각 요소들이 얼마나 떨어져있는지 판단하는 것이다. 대신 각 요소를 제곱했기 떄문에 데이터의 원 스케일 값은 아니다. 표준편차는 각 데이터마다 평균적으로 얼마나 차이가 있는지 판단하는 것이다. 표준편차는 분산의 제곱근이다. 따라서 제곱한 분산의 값을 다시 원래대로 한 것이기 때문에 그 값으로 원래의 데이터 단위로 파악할 수 있다. t-test의 설명. 1. t-test에서 어떤 두 집단 사이의 평균 차이가 5kg 정도 난다고 치자. 2. 만약 이 5kg이 표준편차보다 작다면 5kg 차이에 큰 의미를 둘 수가 없다 라는 뜻이다. 따라서 이 차이가 우연히 발생했다 라는 결론이 생기는 것이다. 3. 하지만 5kg가 표준편차보다 크면 클 수록 큰. 그러면 이 ..
2023.06.11 -
경기도미래기술학교 AI개발자 부트캠프 22일차 TIL- 미니 프로젝트(1) - 주제 정하기: 인구감소. 가설 정하고 데이터 구하기.
오늘은 공부시간이 별로 안되어서 조금만 씀. 미니 프로젝트 주간이다. 나는 인구감소에 대한 원인들을 모으고 그 원인들이 상관관계가 어떻게 되어있는지 분석해보기로 했다. 시작하기 전에 목표를 가지고 가자. 목표를 먼저 적어야 나중에 덜 헤맬 것 같다. 내 목표. 1. pandas와 matplotlib을 전보다 더 숙련되게 사용하는 것. 앞으로도 많이 사용할 것들이기 때문이다. 2. 나만의 결론을 도출하기. 대신 너무 깊게 가지 말기. 우선 출산율 감소에 대한 대표적인 원인들을 분석해보고 내가 생각하는 추론을 세운 뒤, 대한민국은 어떻게 발전해야 하는지 나만의 결론을 꺼내보자. 우선! 시작이 반이다. 코랩 파일을 만들고 수업시간에 배웠던 한글깨짐 테스트를 진행하였다. # colab에서 한글폰트 사용하기 # ..
2023.06.09 -
경기도미래기술학교 AI개발자 부트캠프 21일차 TIL- 회귀분석, t분포 등 통계지식 배우기. 통계는 분산의 마법.
https://eastjin.tistory.com/72 경기도미래기술학교 AI개발자 부트캠프 1일차 TIL : 파워쿼리, 엑셀 실습. 통계학의 기본 개념. 실습과제는 엑셀을 활용한 파워쿼리라는 것을 배웠다. 함께한 주제는 이것이다. 요즘 TV에 트로트가 참 많이 나오는데 과연 다른 장르의 곡들에 비해 인기가 많을까? 라는 논제이다. 멜론의 좋아 eastjin.tistory.com 예전에 적었던 것. 표준편차 : 분산의 제곱근. 데이터가 평균값으로부터 얼마나 떨어져있는지 나타낸다. 분산 : 데이터가 얼마나 분산되어있는지를 나타내는 값. 각 편차의 제곱을 하여 나눈다. https://www.youtube.com/watch?v=5Xke4ao1g9E&list=TLPQMDcwNjIwMjMfgrSYW1RkKw&in..
2023.06.08 -
경기도미래기술학교 AI개발자 부트캠프 20일차 TIL- Numpy를 배운날. Numpy란? ndarray ,reshape
Numpy를 배웠다. 오늘 배운 것은 Pandas에서 개념이 좀 추가된 느낌이여서.. 우선 천천히 정리를 해보자. Numpy란? Numerical Python의 약자로 Numerical은 숫자/수치적인 이라는 의미이다. 뭔가 계산적인 것과 관련된 것을 하는 라이브러리임을 암시한다. 실제로 Numpy는 배열, 선형 대수, 통계 등의 수치 계산 작업을 효율적으로 처리하기 위해 개발되었다. ndarray란 n차원 배열을 나타내는 용어이다. n-Dimensional의 약어이다. 3차원 배열을 처음 만들어봤다. 3차원 배열은 row, column, depth(channel)이라고 부른다고 하는데 사람들마다 좀 다르게 부르나 보다. 4차원까지 가면 time이나 batch라고 부른다고 한다. ndarray도 [] 이..
2023.06.05 -
경기도미래기술학교 AI개발자 부트캠프 19일차 TIL- 써먹을 matplotlib과 헷갈렸던 것 정리.
import matplotlib.pyplot as plt plt.scatter([0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5]) plt.title('산점도') plt.xlabel('키') plt.ylabel('몸무게') # plt.grid(True) plt.show() plt.grid(True)는 격자가 보인다. 안했을 때와 했을 때 bk_df1['대여소번호'] = bk_df1['대여소번호'].astype(object) 대여소번호 라는 컬럼을 object형으로 변환하는 코드이다. notna()와 isnull()의 차이. isnull() 메서드는 누락된 값이면 해당 위치에 True를 반환한다. 그렇지 않을 때는 False를 반환한다. notna() 메서드는 누락된 값이 아닐 때 해당위..
2023.06.04