trainingdata(2)
-
머신러닝 용어, 기본 개념. 학습데이터? 테스트 데이터? 머신러닝 계의 Hello World인 붓꽃(load_iris) 연습하기.
ML 모델 : Machine Learning Model. Feature : 데이터 세트의 일반적인 속성. 학습데이터(Training Data) 레이블(타겟값) : 피처에 기반해서 학습을 기반으로 답을 학습을 하는 것. 어떤 특성의 라벨링을 붙인 것. 테스트 데이터(Test data) 이 때는 Feature들만 주고 답이 없다. Feature를 기반으로 레이블을 예측을 한다. 그래서 예측을 한 레이블의 값과 테스트 데이터에 실제 값을 비교하여 ML 모델이 얼마나 잘 만들어졌는지에 대한 것을 평가한다. import sklearn import pandas as pd from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClass..
2023.06.25 -
지도 학습과 비지도 학습 / training data와 test data의 차이.
지도 학습 : 분류나 회귀(예측) 비지도 학습 : 클러스터링, 차원 축소 머신러닝의 유형 : 베이지안 통계, KNN 알고리즘, 서포트 벡터 머신, 신경망/딥러닝, 결정 트리 traing data : 문제와 답, 문제와 답, 학습을 시킨다. 과정(식)은 머신러닝이여서 학습하지 않는다. 머신러닝 자체는 블랙박스인 것임. test data : 실제는 어떻게 되어있는지 확인하는 데이터. 데이터의 특성을 잘 알아야 한다. 과적합(overfitting) : 트레이닝 데이터가 테스트 데이터에 비해 일반성이 떨어지게 트레이닝을 해서 트레이닝 수치가 테스트보다 높게 나온다.
2023.06.22