분류 전체보기38 K-평균 알고리즘 1. 데이터는 kaggle(캐글)에 공개된 데이터를 썼습니다.https://www.kaggle.com/datasets/joonasyoon/clustering-exercises/data csv파일로 되어있으니 판다스로 읽어서 넘파이배열로 바꾸는 작업을 하겠습니다.!wget https://www.kaggle.com/datasets/joonasyoon/clustering-exercises -O sample.npyimport numpy as npimport pandas as pd import matplotlib.pyplot as pltfrom sklearn.cluster import KMeansbasic1=pd.read_csv('/content/basic1.csv')basic1.head() 데이터를 잘 읽었.. 2024. 5. 20. 지니 불순도(Gini impurity)와 정보 이득 머신 러닝의 세계에서, 의사결정트리(Decision Tree) 알고리즘이 널리 사용되죠. 트리가 너무 복잡하니 가지치기를 해보겠습니다. 6,000여개의 와인 데이터를 결정트리로 만든것인데, gini가 보이죠?이 알고리즘의 핵심 요소 중 하나가 지니 불순도 입니다. 결정트리모델 DecisionTreeClassifier 클래스에 criterion 매개변수가 있는데, 기본값이 gini(= 지니불순도) 입니다. 참고로 criterion 매개변수는 노드에서 데이터를 분할핳 기준을 정하는 것입니다. 결정트리모델은 부모노드와 자식노드의 불순도 차이가 가능한 크도록 트리를 성장시킵니다. 불순도 차이 계산법은아래와 같습니다.부모의 불순도- (왼쪽 노드 샘플 수 / 부모의 샘플 수) X 왼쪽 노드 불순도 -(오른.. 2024. 5. 17. 확률적 경사 하강법 여기 물고기의 종류와 무게, 길이, 두께 데이터가 있다. 그런데, 물고기 데이터가 계속 늘어날 예정이라면? 물고기 마다 일일이 무게를 잴 수 없으니... 무슨 방법이 없을까?방법 1: 데이터가 들어올 때마다 훈련을 다시 시킬까?: 데이터가 계속 늘어나면, 저장공간에 부하가 걸림. 훈련시간도 늘어남. 방법 2: 그러면 이전에 가지고 있던 데이터를 좀 버려서 데이터 크기를 유지할까?: 버려진 데이터에 중요한 내용이 있다면, 큰일임. 방법 3: 훈련시켜 둔 기존 모델을 버리지 말고 새로운 데이터만 추가로 학습 시키자!: 점진적 학습(Incremental Learning) 온라인 학습(Online Learning)이라고 함 대표적인 점진적 학습인 확률적 경사 하강법을 공부해보자import pandas as p.. 2024. 5. 16. Sklearn(사이킷런) 붓꽃 데이터 붓꽃 데이터는 이곳을 참고했습니다.https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html sklearn.datasets.load_irisExamples using sklearn.datasets.load_iris: Release Highlights for scikit-learn 1.2 Release Highlights for scikit-learn 0.24 Release Highlights for scikit-learn 0.22 Plot classification probability ...scikit-learn.org 사이킷런 자체 데이터셋에 있는 붓꽃 데이터를 사용할 경우.# 붓꽃 데이터를 표기하는 방법은 2가.. 2024. 5. 13. 파이썬 장고 공부하기 좋은 곳 1.https://docs.djangoproject.com/ko/5.0/howto/windows/ 윈도우즈에 Django 설치하기 | Django 문서The web framework for perfectionists with deadlines.docs.djangoproject.com 2. https://developer.mozilla.org/ko/docs/Learn/Server-side/Django Django 웹 프레임워크 (파이썬) - Web 개발 학습하기 | MDNDjango는 파이썬으로 구성된, 인기 많고 완벽한 기능을 갖춘 서버-사이드 웹 프레임워크입니다. 이 모듈은 Django가 웹 서버 프레임워크 중 가장 유명한 이유, 개발환경을 설정하는 방법, 그리고 이developer.mozilla.or.. 2024. 5. 2. SQLite 공부할 수 있는 곳 1. SQLhttps://www.w3schools.com/sql/default.asp SQL TutorialW3Schools offers free online tutorials, references and exercises in all the major languages of the web. Covering popular subjects like HTML, CSS, JavaScript, Python, SQL, Java, and many, many more.www.w3schools.com 2. Flask의 SQLite3https://flask-docs-kr.readthedocs.io/ko/latest/patterns/sqlite3.html Flask에서 SQLite 3 사용하기.. 2024. 4. 24. 이전 1 2 3 4 ··· 7 다음