機械学習における過剰適合と過小適合

機械学習は、データからモデルを構築し、未知のデータに対して予測を行うための強力なツールです。しかし、モデルの適合度合いが不適切であると、予測の精度が低下する可能性があります。機械学習における過剰適合(Overfitting)と過小適合(Underfitting)の問題について解説します。

過剰適合 (Overfitting)

過剰適合(Overfitting)は、モデルが訓練データに過度に適合し、訓練データに対する予測性能は非常に高いですが、新しいデータやテストデータに対しては予測性能が低くなる現象です。過剰適合が発生すると、モデルは訓練データのノイズやランダムな変動に過敏に反応し、一般的なパターンを捉える能力が弱まります。典型的な特徴は、モデルが訓練データの細かい詳細に合わせてしまい、ノイズを学習してしまうことです。

過剰適合を防ぐ方法

  • より多くの訓練データを収集する
  • モデルの複雑さを減らす(たとえば、特徴の数を削減する、モデルの深さを減らす)
  • 正則化を適用する(L1正則化、L2正則化など)
  • 交差検証を使用してモデルの性能を評価する

具体例

手書き数字認識のモデルを考えます。過剰適合の場合、モデルは訓練データの各数字の特定の筆跡にまで適合し、訓練データに含まれる個々の書き手のスタイルにも適合します。しかし、新しい手書き数字に対する予測は不正確になります。

過小適合 (Underfitting)

過小適合(Underfitting) は、モデルが訓練データに対して十分な適合を行わず、訓練データおよびテストデータの両方で予測性能が低い状態を指します。これは、モデルがデータの本質的なパターンを捉えるのに不十分な単純さや複雑さを持っている場合に起こります。

過小適合を防ぐ方法

  • より複雑なモデルを使用する(たとえば、特徴の数を増やす、モデルの深さを増やす)。
  • 特徴エンジニアリングを行い、より有用な特徴を抽出する。
  • モデルのトレーニング時間を増やす。
  • 適切なハイパーパラメータを選択する。

具体例

線形回帰モデルを考えます。過小適合の場合、モデルはデータ内の複雑な関係を捉えられず、訓練データに対しても未知のデータに対しても予測が正確でないことがあります。

まとめ

過剰適合と過小適合の問題を解決するために、適切なモデルの複雑さを選択し、適切な正則化テクニックを使用する必要があります。また、訓練データとテストデータを適切に分割し、モデルの性能を評価することが重要です。機械学習の成功には、過剰適合と過小適合のバランスを見つけ、適切なモデルを構築する能力が不可欠です。

見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑 [ 秋庭 伸也 ]