投稿

ラベル(Python)が付いた投稿を表示しています

Pythonで機械学習体験(scikit-learn)

イメージ
scikit-learnとは scikit-learnは、Pythonで機械学習を簡単に実装するための代表的なライブラリです。 ※読み方はサイキットラーン 公式ドキュメント : https://scikit-learn.org/stable/index.html Pythonで機械学習を行うときの定番中の定番です。 できること 分類 数字認識、迷惑メール判定 回帰 売上予測、価格予測 クラスタリング 顧客分類 データ分割 学習用・テスト用分離 評価 正解率計算 学習済みデータセット load_digits(手書き数字画像)... etc 今回は手書き数字画像の学習済みデータセットを使用して、手書き画像認識の機械学習をやってみます。 load_digitsは1797枚の手書きの数字データと、それの正解ラベル(0〜9)が含まれるデータセットです。 ここで重要なのは「AIは最初から数字を理解しているわけではない」という点です。 大量の「問題と答え」を見て学習しています。 サンプルスクリプト スクリプトの仕様 キャンバスを起動して数字を描く 描かれた画像データを学習済みデータセットを使用して認識する 精度が低い、または間違っている場合は、教師あり学習データとして利用できる 使用するライブラリ scikit-learn 機械学習 opencv-python 画像処理・画面操作 numpy 数値データ処理 スクリプト # pip install scikit-learn opencv-python numpy import cv2 import numpy as np from sklearn.datasets import load_digits from sklearn.svm import SVC # 1. 学習データを読み込み digits = load_digits() X = digits.data y = digits.target # 2. モデルを学習 # probabili...