今日のペースの速いデジタル世界では、組織は新しい情報システムを迅速に構築するために、ローコード/ノーコードのアプリケーションを使用しています。この記事では、Pythonで書かれたローコード機械学習ライブラリであるPyCaretを紹介します。
PyCaretはプログラミング言語R用のCaretパッケージのPython版で、多くの利点があります。
- 生産性の向上: PyCaretは生産性を向上させるローコードライブラリです。コーディングに費やす時間を減らすことで、あなたとあなたのチームはビジネスの問題に集中することができます。
- 使いやすい: この使いやすい機械学習ライブラリは、少ないコード行数でエンドツーエンドの機械学習実験を行うのに役立ちます。
- 商用利用可能: PyCaret は商用利用可能なソリューションです。ノートブック環境から素早く効率的にプロトタイプを作成することができます。
PyCaret のフルバージョンをインストールするには、Python で仮想環境を作成し、以下のコマンドを実行します:
pip install pycaret [full]
機械学習の実務者は、分類、回帰、クラスタリング、異常検出、自然言語処理、アソシエーションルール・マイニング、時系列分析に PyCaret を使用できます。
PyCaretを使った分類モデルの構築
本稿では、PyCaretのデータウェアハウスからIrisデータセットを取得し、PyCaretを用いた分類モデルの構築について説明します。
Google Colabの環境を使い、以下の手順で進めていきます。
ステップ1
まず、以下のコマンドを実行して PyCaret をインストールします:
pip install pycaret
ステップ2
次に、図2に示すように、データセットをロードします:
from pycaret.datasets import get_data
dataset = get_data('iris')
import pandas as pd
dataset = pd.read_csv('/path_to_data/file.csv')
ステップ3
図 2 に示すように PyCaret 環境をセットアップします:
from pycaret.classification import *
clf1 = setup(data=dataset, target = '種')
環境を設定することは、PyCaret を使ってあらゆる種類のモデルを構築する上で最も重要なステップです。デフォルトでは、setup() 関数は引数 data と target を受け取ります。 デフォルトでは、setup() 関数はデータの 70% をトレーニングセット、30% をテストセットに分割し、図 3 に示すようにデータの前処理を行います。
ステップ4
次に、図4に示すように、最適なモデルを見つけます:
best = compare_models()
デフォルトでは、compare_models() は、10重のクロスバリデーションを適用し、図4に示すように、より少ない学習時間で、異なる分類器について、精度、AUC、リコール、精度、F1スコア、カッパ、MCCなどの様々な性能指標を計算します。すべての分類器は、compare_models()関数にtubro=Trueを渡すことで試すことができます。
ステップ5
ここで、図5に示すようなモデルを作成します:
lda_model=create_model ('lda')
線形判別分析分類器は、図4に示すように良好な結果を示します。したがって、 create_model() 関数にldaを渡すことで、モデルをフィッティングすることができます。
ステップ6
次のステップは、図6に示すようにモデルを微調整することです。
tuned_lda=tune_model(lda_model)
tune_model()関数は、図7に示すように、線形判別分析モデルの精度を0.9818から0.9909に向上させます。
ステップ7
次のステップは、図8に示すように、予測を行うことです:
predictions=predict_model(tuned_lda)
predict_model() 、テストデータに存在するサンプルについて予測を行うために使用されます。
ステップ8
モデルの性能は図9のようにプロットされます:
evaluate_model(tuned_lda)
evaluate_model() 、最小限の労力でさまざまなパフォーマンス指標を開発するために使用されます。試して出力を見てください。
を経由して





