초보(2)
-
sas 처음. 코드 설명하기.
libname ahffk "/home/u638/sasdata"; data ahffk.aaa; input x @@; datalines; 1 2 3 4 5 6 7 8 9 10 ; run; proc means; var x; run; data aaa; aaa 라는 이름에 dataset임. input x @@; : x는 변수 선언이고 @@는 한 줄에 여러 개 다 읽으라는 명령어다. datalines; 이 줄 이후 나타나는 데이터가 실제 데이터들이다. run : 데이터의 끝을 나타내는 말. proc : 프로시저의 줄임말. 절차임. 여기서 means의 절차를 구해온다. means는 평균, 표준편차, 최댓값, 최솟값을 불러온다. var x는 이 proc가 어떤 것을 분석할 것인지 정하는 것이다. 여기서 input과 v..
2024.03.26 -
머신러닝 용어, 기본 개념. 학습데이터? 테스트 데이터? 머신러닝 계의 Hello World인 붓꽃(load_iris) 연습하기.
ML 모델 : Machine Learning Model. Feature : 데이터 세트의 일반적인 속성. 학습데이터(Training Data) 레이블(타겟값) : 피처에 기반해서 학습을 기반으로 답을 학습을 하는 것. 어떤 특성의 라벨링을 붙인 것. 테스트 데이터(Test data) 이 때는 Feature들만 주고 답이 없다. Feature를 기반으로 레이블을 예측을 한다. 그래서 예측을 한 레이블의 값과 테스트 데이터에 실제 값을 비교하여 ML 모델이 얼마나 잘 만들어졌는지에 대한 것을 평가한다. import sklearn import pandas as pd from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClass..
2023.06.25