경기도미래기술학교 AI개발자 부트캠프 55일차 TIL- 캐글 코드 클론코딩 하기. Store Sales TS Forecasting - A Comprehensive Guide

2023. 7. 25. 10:02카테고리 없음

반응형

 

 

오늘은 배웟던 것을 토대로 클론코딩을 해보기로 했다. 100% 클론코딩은 아니고 한 80% 정도!

 

https://www.kaggle.com/code/ekrembayar/store-sales-ts-forecasting-a-comprehensive-guide

 

Store Sales TS Forecasting - A Comprehensive Guide

Explore and run machine learning code with Kaggle Notebooks | Using data from Store Sales - Time Series Forecasting

www.kaggle.com

 

이분이 이 주제에 대해서 따봉이 제일 많아서 이분 것을 들어가서 진행했다. 

데이터는 에콰도르 것인데, 상품판매 분석이다. 

 

데이터는 이런 식으로 있다. 내가 분석한 것을 토대로 test 데이터의 약 보름 정도 타겟 데이터를 예측해야 하는 것이 과제이다.

 

train_df["date"] = pd.to_datetime(train_df.date)
test_df["date"] = pd.to_datetime(test_df.date)
holiday_df["date"] = pd.to_datetime(holiday_df.date)
oil_df["date"] = pd.to_datetime(oil_df.date)
transactions_df["date"] = pd.to_datetime(transactions_df.date)

우선 date라고 되어있는 컬럼이 info로 조회해보니 object 타입으로 되어있어 싹다 바꿨다.

 

그리고 transactions와 각 매장별 매출(sales)의 관계가 높은 상관관계가 있다는 것을 알 수 있었다.(당연한 것인가)

scatterplot을 그려보니 상관관계가 있다는 것을 알 수 있었다.

 

다음은 연도별 판매량 분석이다. 2017년은 8월 중순까지 데이터가 있고, 나머지 데이터를 보니 연말 판매량이 눈에 띄게 높은 것을 알 수 있다.

 

우선 여기까지~

728x90