評価が研修 80%、評価 20% であり、その逆ではないのはなぜですか?

by グエンスアントゥン / 木曜日、17 8月2023 / に掲載されました Artificial Intelligence, EITC/AI/GCMLGoogleクラウド機械学習, 機械学習の最初のステップ, 機械学習の7つのステップ

機械学習のコンテキストでトレーニングに 80% の重みを割り当て、評価に 20% の重みを割り当てることは、いくつかの要因に基づいた戦略的な決定です。この分散は、学習プロセスの最適化とモデルのパフォーマンスの正確な評価の確保との間でバランスをとることを目的としています。この回答では、この選択の背後にある理由を掘り下げ、それが提供する教訓的価値を探ります。

80% のトレーニングと 20% の評価の分割の背後にある理論的根拠を理解するには、機械学習の XNUMX つのステップを理解することが重要です。データ収集、データの準備、モデルのトレーニング、モデルの評価、モデルのチューニング、モデルのデプロイ、モデルのモニタリングを含むこれらの手順は、機械学習モデルを構築するための包括的なフレームワークを形成します。

最初のステップであるデータ収集には、モデルをトレーニングするための関連データの収集が含まれます。このデータは、データ準備フェーズで前処理されて準備されます。データの準備が完了すると、モデルのトレーニングフェーズが開始され、モデルがトレーニングデータセットに公開されてパターンと関係が学習されます。次に、モデルのパフォーマンスは、モデル評価フェーズで別のデータセットを使用して評価されます。

80% の重みをトレーニングに割り当て、20% の重みを評価に割り当てるという決定は、トレーニングがモデルがデータから学習する主要なフェーズであるという事実に基づいています。トレーニング中、モデルは内部パラメーターを調整して、その予測出力とトレーニングデータセット内の実際の出力の差を最小限に抑えます。このプロセスには、勾配降下法などの最適化アルゴリズムを使用してモデルのパラメーターを繰り返し更新することが含まれます。

トレーニングにより高い重みを割り当てることで、データから学習して複雑なパターンを捕捉するモデルの能力を優先します。トレーニングフェーズでは、モデルが知識を取得し、トレーニングデータセットから一般化して、目に見えないデータを予測します。モデルが公開されるトレーニングデータが増えるほど、モデルはより適切に学習し、一般化することができます。したがって、評価プロセスのかなりの部分をトレーニングに充てることで、モデルが効果的に学習するためにトレーニングデータに十分にさらされることが保証されます。

一方、評価フェーズは、目に見えないデータに対するモデルのパフォーマンスを評価する際に重要な役割を果たします。評価データセットはトレーニングデータセットとは別にあり、現実世界のシナリオのプロキシとして機能します。これにより、モデルがその学習を新しいまだ見たことのないインスタンスにどの程度一般化できるかを評価することができます。モデルのパフォーマンスを評価することは、特定の問題領域に応じて、その精度、精度、再現率、またはその他の関連する指標を測定するために不可欠です。

評価に 20% の重みが与えられることで、モデルが目に見えないデータで厳密にテストされ、その機能の現実的な評価が得られるようになります。この評価フェーズは、モデルの予測における過学習、過小学習、偏りなどの潜在的な問題を明らかにするのに役立ちます。また、ハイパーパラメーターとモデルアーキテクチャを微調整してパフォーマンスを向上させることもできます。

この概念を説明するために、実際の例を考えてみましょう。猫と犬の画像を分類する機械学習モデルをトレーニングしているとします。トレーニングフェーズでは、モデルはラベル付き画像の大規模なデータセットを分析することによって、猫と犬の特徴を区別することを学習します。モデルがトレーニングできる画像が増えるほど、XNUMX つのクラスを区別しやすくなります。

トレーニングが完了すると、モデルは、これまでに見たことのない画像を含む別のデータセットを使用して評価されます。この評価フェーズでは、モデルの学習を一般化し、新しい未確認の画像を正確に分類する能力をテストします。評価に 20% の重みを割り当てることで、モデルのパフォーマンスが目に見えないデータに基づいて徹底的に評価され、その有効性の信頼できる尺度が提供されるようになります。

機械学習におけるトレーニングに 80% の重み付け、評価に 20% の重み付けを配分することは、モデルのパフォーマンスの正確な評価を確保しながら学習プロセスを最適化することを目的とした戦略的な選択です。評価プロセスのかなりの部分をトレーニングに充てることで、データから学習して複雑なパターンを捕捉するモデルの能力を優先します。同時に、評価フェーズでは、目に見えないデータに基づいてモデルを厳密にテストし、その機能の現実的な評価を提供します。

その他の最近の質問と回答 EITC/AI/GCMLGoogleクラウド機械学習:

EITC/AI/GCML Google Cloud Machine Learning のその他の質問と回答を表示する

その他の質問と回答:

フィールド： Artificial Intelligence
プログラム： EITC/AI/GCMLGoogleクラウド機械学習 (認定プログラムに進む)
レッスン：機械学習の最初のステップ (関連するレッスンに行く)
トピック：機械学習の7つのステップ (関連トピックに移動)

下に追加されたタグ： Artificial Intelligence, データの準備, 機械学習, モデル評価, モデルトレーニング, 最適化アルゴリズム

EITCAアカデミー

評価が研修 80%、評価 20% であり、その逆ではないのはなぜですか?

その他の最近の質問と回答 EITC/AI/GCMLGoogleクラウド機械学習:

その他の質問と回答:

EITCA アカデミーはヨーロッパの IT 認定フレームワークの一部です

EITCAアカデミーの資格80％EITCIDSJC補助金サポート

EITCAアカデミー

ユーザー名またはメールアドレスでアカウントにログインします。

詳細をお忘れですか？

アカウントを作成する

評価が研修 80%、評価 20% であり、その逆ではないのはなぜですか?

その他の最近の質問と回答 EITC/AI/GCMLGoogleクラウド機械学習:

その他の質問と回答:

EITCAアカデミーの資格80％EITCIDSJC補助金サポート