閾値設定
境目となる値を設定すること
目次
閾値設定とは
AIの機械学習(ML:Machine Learning)には、教師あり学習(SL:Supervised Learning)、教師なし学習(UR:Unsupervised Learning)、強化学習(RL:Reinforcement Learning)があり、機械学習のアルゴリズムは、分類、回帰、クラスタリング、次元削除、異常検知に分けられる。また、分類の手法に、ランダムフォレスト、ロジスティツク回帰、サポートベクターマシン(SVM:Supprt Vector Machine)がある。
ランダムフォレスト
複数の決定木(Decision Tree:閾値設定して分類する方法)で、出た結果を多数決または平均をとって最終的な結果を出力する手法で、大量のデータをを必要とするが、精度の高い予測・分類ができる。
ロジステック回帰
目的変数が2値(Yes、No)判別の時に利用し、主に医学分野で使われる。
サポートベクターマシン
カーネルトリックと呼ばれる方法を用いて、非線形の識別関数を実装し、認識性能の優れた分類・回帰に利用可能な教師あり学習モデル。
機械学習
専門家が事前に特微量(データの特徴を定量的に表現)を設定・修正し、精度(判断、識別、予測)をあげる。ディープラーニングは、パターンやルールの発見、特微量の設定、学習を自動的に行う。
教師あり学習
学習(学習データに正解を用意する)し、正解がわかっていないデータを認識・予測する。
教師なし学習
データの構造・特徴を分析し、グループ分けし、人が結果を解釈する。
強化学習
学習データに正解はないが、目的として設定した報酬(スコア)を最大化するように試行錯誤処理し、学習する。
データ整備サービスの詳細
データ整備サービスでは「データ確認」と「データ整備」を繰り返し、データ活用の課題解決をお手伝いいたします。
Step1 データ確認(データ確認レポート):データ項目毎の「最小値、最大値、最小件数、最大件数、最小桁数、最大桁数」をレポートで確認
CSVファイルとテーブル仕様をお預かりし、データ確認レポートを短期間(最短2日)で作成いたします。
テーブル編集仕様の作成をお客様で行うことが難しい場合は、弊社にて作成サポートも行っていますのでご安心ください。
Step2 データ整備:テーブル編集仕様をもとに、新たなデータを作成
いただいたテーブル編集仕様を元に、お預かりしているCSVファイルを整備・加工して、短期間(最短4日)でCSVファイルをお返しいたします。
Step3 データ再確認(データ確認レポート):新たなデータ項目毎の「最小値、最大値、最小件数、最大件数、最小桁数、最大桁数」をレポートで確認
データ整備が終わった後のCSVファイルがテーブル編集仕様に沿ったデータであることを、データ確認レポートによって確認いたします。
もしER図をいただくことができれば、テーブル間整合性レポートの作成も合わせていたします。