머신러닝(4)
-
예측 등락률을 classifier로 바꿔봤다.
예측 등락률을 classifier로 바꿨다. 감성분류도 -1, 0, 1로 바꿔볼까..? 우선 예측 등락률만 바꿔봤다. df_joined['예측_등락률'] = df_joined['예측_등락률'].apply(lambda x: 1 if x > 0.1 else (-1 if x < -0.1 else 0)) apply lambda를 사용해서 이런 식으로 진행했다. 그랬더니 0.065가 나옴! 오;; 성과인가? positive_lexicon = ['러브', '콜', '만점', '만점', '상승', '회복', '적극', '정착', '세계최초','강세','보상','잘 만들다','정확하다','칭찬','응원','좋은','소중한','가능하다','강화하다','신뢰','민생안정','대응전략','극복방안','복원력','방도','안..
2023.08.14 -
주식 머신러닝. 테마주는 투자 조졌다. sns.heatmap까지 했는데 결과가 너무 안좋았다.
내 몸으로 테스트를 질렀는데 어제 포스팅 했던 애들이 그냥 개박살이 나버렸다. 하이브도 떨어지고 우원개발은 5%가 넘게 떨어지고 뉴보텍은 10%가 떨어지고! 이미 오를대로 올라서 그런가? 테마주가 내가 이번 주에 느낀게 있는데 딱 사건이 벌어진다! 라고 했을 때 바로바로 사야 한다. 하루 정도는 늦어도 괜찮다. 아무튼 생각하지말고 퍼뜩! 아무튼... 빡친 상태로 공부를 해보니까 좀 잘되는 것 같기도 하고 그렇다. 뉴스 df + 한국거래소에서 가져온 다음날 등락률을 join해서 NaN값은 결측처리 하고 히트맵을 돌려봤다. ㅋ. 예측 등락률과 저게 잘 맞아야 하는데 하나도 안맞네? 내 분류가 틀렸거나 그냥 프로젝트 가설 자체가 조졌거나이다. 사실 주식 예측을 한다는 것이 되게 힘든 일이긴 한데.. 그래도 잘..
2023.08.10 -
방법이 잘 안떠오른다. 투자를 하면서... 생각을 좀 해보자. 태풍 관련주, 하이브 투자.
푼돈으로 직접 투자를 하며 생각을 해보자. 현재 문제점이 뭐냐하면 ... 유명한 기업들을 빼면 기사 자체가 안나오는 날이 많다.. 요즘은 태풍이 불고 있는데 태풍 관련 주는 요즘 많이 뜨기는 하지만 최근 3개월 검색해보면 몇 개 뜨지 않는다. 그래서 어떻게 할까 하다가 일단 투자는 투자대로 하기로 했다. 우선 초전도체로 만 원 정도 이득을 봤던 게 있는데 그거는 뉴보텍 이라는 지진 테마주에 10주를 넣었다. 그리고 우원개발이라는 곳에 다 오른 마당에 투자를 조금 했다. 사람들 이미 다 알고 있는 주다. 내일은 과연 오를까? 그리고 현대, 삼성 이런 것도 많았는데 내 기준에서는 좀 관심 밖인 회사가 하나 나왔다. 하이브? 뭘까. 수집을 한다음 돌려봤다. 한국어 분류가 너무 어렵다~~ 아직 분류 안된 것 2..
2023.08.09 -
머신러닝 용어, 기본 개념. 학습데이터? 테스트 데이터? 머신러닝 계의 Hello World인 붓꽃(load_iris) 연습하기.
ML 모델 : Machine Learning Model. Feature : 데이터 세트의 일반적인 속성. 학습데이터(Training Data) 레이블(타겟값) : 피처에 기반해서 학습을 기반으로 답을 학습을 하는 것. 어떤 특성의 라벨링을 붙인 것. 테스트 데이터(Test data) 이 때는 Feature들만 주고 답이 없다. Feature를 기반으로 레이블을 예측을 한다. 그래서 예측을 한 레이블의 값과 테스트 데이터에 실제 값을 비교하여 ML 모델이 얼마나 잘 만들어졌는지에 대한 것을 평가한다. import sklearn import pandas as pd from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClass..
2023.06.25