GOAICAMP(36)
-
경기도미래기술학교 AI개발자 부트캠프 73일차 TIL- sqld 공부. 데이터베이스 모델링과 정규화
모델링이란? 데이터의 개념적 표현을 만들고, 데이터 엔터티가 서로 관련되는 방식을 설정하고, 데이터가 데이터베이스에 저장되는 방식에 대한 프레임워크를 설정하는 프로세스. 시스템에서 데이터베이스를 구현하기 위한 청사진 같은 역할이다. 추상화 : 시스템이 관리할 수 있는 방식으로 데이터를 나타내기 위해 현실의 필수 측면을 표현한다. 단순화 : 복잡한 시스템을 더 간단하고 관리하기 쉬운 구성 요소로 나누는 과정 명확화 : 사물을 명확하고 이해하기 쉽게 만드는 것. 유의점 : - 중복 : 여러 장소에 같은 정보를 중복 저장하지 않도록 중복성 최소화한다. - 비유연성 : 데이터의 정의를 데이터 사용 프로세스와 분리해서 유연성을 높인다. 비유연성(경직성)의 경우는 데이터베이스 시스템이 요구사항이나 어떤 구조를 바꾸..
2023.08.21 -
경기도미래기술학교 AI개발자 부트캠프 59일차 TIL- 파이썬 클래스 공부하기.
예전에 배웠던 것들인데 가물가물~ 복습하는 느낌으로 간다. attribute : 클래스의 기본 속성. method : 어떤 행동 같은 것. 어떤 인스턴스를 통해 생성되는 것은 인스턴스 메소드. class Car: def drive(self): print('Driving Start!') #instance 생성 mycar = Car() #instance method mycar.drive() 우리가 흔히 쓰는 a = 123123 이런 것도 클래스를 사용한 것이다. a라는 인스턴스를 선언한 것이니까. print(isinstance(mycar, Car)) isinstance를 하면 mycar라는 오브젝트가 해당 클래스의 인스턴스인지를 True 혹은 False로 구분되어 나온다. 오늘 배운 __init__ 이거는 ..
2023.07.31 -
경기도미래기술학교 AI개발자 부트캠프 56일차 TIL- 캐글 코드 클론코딩 하기 - 2. Store Sales TS Forecasting - A Comprehensive Guide
계속한다. https://www.kaggle.com/code/ekrembayar/store-sales-ts-forecasting-a-comprehensive-guide Store Sales TS Forecasting - A Comprehensive Guide Explore and run machine learning code with Kaggle Notebooks | Using data from Store Sales - Time Series Forecasting www.kaggle.com 이분 것 참고. 이거를 짜고 있는데 Oil 데이터에 NaN 값이 많기 때문이다. 이것을 interpolated로 처리했다. 근데 이분은 아래와 같은 방법으로 먼저 resample을 했다. oil_df.set_index(..
2023.07.26 -
경기도미래기술학교 AI개발자 부트캠프 55일차 TIL- 캐글 코드 클론코딩 하기. Store Sales TS Forecasting - A Comprehensive Guide
오늘은 배웟던 것을 토대로 클론코딩을 해보기로 했다. 100% 클론코딩은 아니고 한 80% 정도! https://www.kaggle.com/code/ekrembayar/store-sales-ts-forecasting-a-comprehensive-guide Store Sales TS Forecasting - A Comprehensive Guide Explore and run machine learning code with Kaggle Notebooks | Using data from Store Sales - Time Series Forecasting www.kaggle.com 이분이 이 주제에 대해서 따봉이 제일 많아서 이분 것을 들어가서 진행했다. 데이터는 에콰도르 것인데, 상품판매 분석이다. 데이터는 ..
2023.07.25 -
경기도미래기술학교 AI개발자 부트캠프 53일차 TIL- 주가예측 머신러닝
fdr.StockListing? 이렇게 메서드에 ?를 치면 인자값 같은 것이 나온다. https://jhy156456.tistory.com/entry/python-shift-pctchange-diff-rolling-resample [python] shift() , pct_change(), diff(), rolling(), resample() [python] shift() , pct_change(), diff(), rolling(), resample() shift() 인덱스에 연결된 데이터를 일정 간격으로 이동시키는 함수. default => period = 1, axis=0(row) axis=1을 하면 데이터가 오른쪽으로 이동하게 된다. mmm jhy156456.tistory.com 여러가지 계산법들이 ..
2023.07.20 -
경기도미래기술학교 AI개발자 부트캠프 52일차 TIL- 머신러닝 공부 계속. randomforestclassifier 등
LogisticRegression(solver='liblinear') 이건 뭔지 모르겠는데..? from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y, random_state=42) stratify를 쓰면 학습데이터와 트레이닝, 테스트의 분포가 원래 데이터와 동일하도록 학습시키는 것. 뭔가 치우친 데이터에 적용할 때 특히 유용하다. 임의로 20% 뽑았을 때 잘 안나올 수도 있으니까 이것을 사용한다. 과적합 : 트레이닝 데이터가 테스트에 비해 학습이 잘되긴 하는데, 새로운 값이 들어오면 잘 안맞는 경우가 있음. 앙상블..
2023.07.19