Sklearn(사이킷런) 붓꽃 데이터

붓꽃 데이터는 이곳을 참고했습니다.

https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html

sklearn.datasets.load_iris

Examples using sklearn.datasets.load_iris: Release Highlights for scikit-learn 1.2 Release Highlights for scikit-learn 0.24 Release Highlights for scikit-learn 0.22 Plot classification probability ...

scikit-learn.org

사이킷런 자체 데이터셋에 있는 붓꽃 데이터를 사용할 경우.

# 붓꽃 데이터를 표기하는 방법은 2가지 입니다
# 사이킷런의 데이터 셋에서 아이리스를 직접 가져올 경우

from sklearn.datasets import load_iris
iris = load_iris()


# 
# 사이킷런의 데이터 셋만 가져오는 경우

from sklearn import datasets
iris = datasets.load_iris() 
#데이터셋에 속해있는 아이리스 데이터라고 콕 집어줘야 합니다

kaggle(캐글)에 있는 붓꽃 데이터를 사용할 경우

https://www.kaggle.com/datasets/uciml/iris

import pandas as pd

# !wge 명령어로 인터넷에 있는 데이터를 다운받아
!wget https://www.kaggle.com/datasets/uciml/iris?select=Iris.csv -O Iris.csv

iris = pd.read_csv('/content/Iris.csv', encoding="cp949")

# 이렇게 쓰는데, 계속 에러난다!!!! 이유가 뭐야!!!!

때문에 인터넷상의 csv파일을 다운받아서 -> 아래와 같이 코랩에 직접 넣는 걸 추천합니다.

import pandas as pd
iris = pd.read_csv('/content/Iris.csv', encoding="cp949")

코랩에 직접 데이터를 올린것이라. 에러 없어요~

아이리스의 정보도 볼 수 있고

iris.info()

아이리스 데이터의 상위 5번재 줄까지 내용도 보고

iris.head()

아이리스 데이터를 처리하려면 아무래도 넘파이배열로 바꿔야겠죠.

import numpy as np

npiris = iris.to_numpy()
print(npiris)

'머신러닝' 카테고리의 다른 글

K-평균 알고리즘 (0)	2024.05.20
지니 불순도(Gini impurity)와 정보 이득 (0)	2024.05.17
확률적 경사 하강법 (0)	2024.05.16

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

좋은 정보

Sklearn(사이킷런) 붓꽃 데이터

'머신러닝' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

Sklearn(사이킷런) 붓꽃 데이터

'머신러닝' 카테고리의 다른 글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역