경기도미래기술학교 AI개발자 부트캠프 55일차 TIL- 캐글 코드 클론코딩 하기. Store Sales TS Forecasting - A Comprehensive Guide
2023. 7. 25. 10:02ㆍ카테고리 없음
반응형
오늘은 배웟던 것을 토대로 클론코딩을 해보기로 했다. 100% 클론코딩은 아니고 한 80% 정도!
https://www.kaggle.com/code/ekrembayar/store-sales-ts-forecasting-a-comprehensive-guide
이분이 이 주제에 대해서 따봉이 제일 많아서 이분 것을 들어가서 진행했다.
데이터는 에콰도르 것인데, 상품판매 분석이다.
데이터는 이런 식으로 있다. 내가 분석한 것을 토대로 test 데이터의 약 보름 정도 타겟 데이터를 예측해야 하는 것이 과제이다.
train_df["date"] = pd.to_datetime(train_df.date)
test_df["date"] = pd.to_datetime(test_df.date)
holiday_df["date"] = pd.to_datetime(holiday_df.date)
oil_df["date"] = pd.to_datetime(oil_df.date)
transactions_df["date"] = pd.to_datetime(transactions_df.date)
우선 date라고 되어있는 컬럼이 info로 조회해보니 object 타입으로 되어있어 싹다 바꿨다.
그리고 transactions와 각 매장별 매출(sales)의 관계가 높은 상관관계가 있다는 것을 알 수 있었다.(당연한 것인가)
scatterplot을 그려보니 상관관계가 있다는 것을 알 수 있었다.
다음은 연도별 판매량 분석이다. 2017년은 8월 중순까지 데이터가 있고, 나머지 데이터를 보니 연말 판매량이 눈에 띄게 높은 것을 알 수 있다.
우선 여기까지~
728x90