파이썬(19)
-
n-grams import 해서 활용하기. 슬슬 헷갈리는 부분.
지금 형태소 분류로 하고 있는데, 우리 팀 팀원분들도 언급했던 이 문제. 형태소로 분류하니까 한국어같은 경우는 굉장히 잘게 쪼개지거나 되도 않는 형태소가 나오는 경우가 많다. 예를 들면 '빨간불'이라고 가정해보자. 지금 나는 주식을 하고 있으니까.. 일반적으로 맥락상 회사에 빨간불 이라고 하면 안좋은 의미이다. 근데 이 빨갛다 라는 단어 자체는 모호하다. 종목이 상승할 때는 빨간색이잖아.. 그러면 오히려 좋은 의미이다. 지금 이 구분에서 비상이 걸렸다. 어떻게 하면 좋을까? 하며 도입을 한게 n-grams다. 예를들면 '빨간 불이 들어왔다.' 라는 문장이 있고 n-grams을 써서 문장 분류를 2로 한다면 '빨간 불' 과 '불 이', '이 들어왔' 이런 식으로 2개씩 나뉘어져서 들어오는 것. #df에서 ..
2023.08.06 -
기사를 통한 감성분석 분류해보기.
https://www.bigkinds.or.kr/ 빅카인즈(BIG KINDS) 뉴스빅데이터 분석시스템, 뉴스 속 키워드 관계망, 주요 이슈, 정보원, 이슈 트렌드 분석 정보 제공 www.bigkinds.or.kr 여기 사이트에서 뉴스분석 엑셀 다운로드를 했다. 일단 테스트를 해봐야 해서, LG 화학을 검색해 가져왔다. df = pd.read_excel('./LG화학.xlsx') xlsx 파일이어서 이렇게 pd.read_excel로 가져왔다. 왜 여태 csv를 했지? csv만의 장점이 뭐지? 약간 무지성으로 따라한 느낌이다. 이런 식으로 데이터를 가져옴. import re def test_text_preprocessing(text, mecab): stopwords = ['그리고', '그런데', '그러나',..
2023.08.05 -
파이썬 def 메서드 정의할 때 ->가 헷갈림. 브루트 포스로 인덱스 반환 계산하기.
from typing import List def twoSum(nums: List[int], target: int) -> List[int]: for n in range(len(nums)): for n2 in range(n+1, len(nums)): if nums[n] + nums[n2] == target: return List[n, n2] print(twoSum([7,11,15, 2], 9)) 이거 위에 있는 것 틀린 코드다. 실행하면 에러남. 리스트 형 반환하는게 헷갈린다. List로 반환하면 오류가 난다. return [n, n2] 로 해야 한다. from typing import List def twoSum(nums: List[int], target: int) -> List[int]: num_dic..
2023.08.02 -
파이썬에서 yaml. 디비 정보 등 개인정보 보호하기.
간단한 프로젝트를 만들고 있는데 깃허브에 푸쉬를 하려고 하니까 뭔가... 쎄한 느낌이 들어서 내 코드를 봤다. from flask import Flask, render_template, request, jsonify from pymongo.mongo_client import MongoClient import certifi from collections import Counter import yaml with open('config.yml', 'r') as f: config = yaml.safe_load(f) username = config['MONGODB']['USERNAME'] password = config['MONGODB']['PASSWORD'] host = config['MONGODB']['HOS..
2023.07.24 -
몽고디비와 파이썬이 SSL 문제로 연결이 안될 때. import certifi
https://spartacodingclub.kr/community/fastqna/all/62d524a91809791762af6496/MAC%20MongoDB%EC%97%B0%EA%B2%B0 스파르타코딩클럽 커뮤니티 | 스파르타코딩클럽 수강생이라면 누구나 나만 놓칠 수 없는 이야기들이 가득한 자유게시판, 코딩하다 막히면 바로 질문하는 즉문즉답, 개발일지 모음까지 spartacodingclub.kr from pymongo.mongo_client import MongoClient import certifi ca = certifi.where() client = MongoClient("mongodb+srv://:@cluster0.nb3pybc.mongodb.net/?retryWrites=true&w=majori..
2023.07.19 -
머신러닝 용어, 기본 개념. 학습데이터? 테스트 데이터? 머신러닝 계의 Hello World인 붓꽃(load_iris) 연습하기.
ML 모델 : Machine Learning Model. Feature : 데이터 세트의 일반적인 속성. 학습데이터(Training Data) 레이블(타겟값) : 피처에 기반해서 학습을 기반으로 답을 학습을 하는 것. 어떤 특성의 라벨링을 붙인 것. 테스트 데이터(Test data) 이 때는 Feature들만 주고 답이 없다. Feature를 기반으로 레이블을 예측을 한다. 그래서 예측을 한 레이블의 값과 테스트 데이터에 실제 값을 비교하여 ML 모델이 얼마나 잘 만들어졌는지에 대한 것을 평가한다. import sklearn import pandas as pd from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClass..
2023.06.25