一体、正則化とは何ですか?

プラトン再発行

フォロワー： 0

一体、正則化とは何ですか?

「1 オンスの予防は 1 ポンドの治療に匹敵する」という古いことわざは、何かが起こってからダメージを修復するよりも、最初から何かが起こらないようにする方が簡単であることを私たちに思い出させます。

人工知能 (AI) の時代において、このことわざは、正則化などの技術を通じて過剰適合などの潜在的な落とし穴を回避することの重要性を強調しています。

この記事では、Sci-kit Learn (機械学習) と Tensorflow (深層学習) を使用してその基本原理から正則化を応用し、これらの結果を比較することでその変革力を実世界のデータセットで確認します。はじめましょう！

正則化は、モデルの過剰適合を防ぐことを目的とした機械学習と深層学習における重要な概念です。

過学習は、モデルがトレーニングデータを学習しすぎると発生します。この状況は、あなたのモデルが真実であるにはあまりにも優れていることを示しています。

過剰適合がどのようなものかを見てみましょう。

一体、正則化とは何ですか?

正則化手法は学習プロセスを調整してモデルを簡素化し、モデルがトレーニングデータで適切に実行され、新しいデータに対して適切に一般化されるようにします。これを行う 2 つのよく知られた方法を検討します。

機械学習では、正則化は線形回帰やロジスティック回帰などの線形モデルに適用されることがよくあります。この文脈において、最も一般的な正規化形式は次のとおりです。

L1 正則化 (Lasso 回帰)
L2 正則化 (リッジ回帰)

ラッソ正則化 一部の係数値を正確にゼロにできるようにすることで、モデルが最も重要な特徴のみを使用するように促します。これは、特徴の選択に特に役立ちます。

方程式

方程式
一体、正則化とは何ですか?

一方、 リッジの正則化 係数の値の 2 乗にペナルティを課すことで、有意な係数を妨げます。

方程式

方程式
一体、正則化とは何ですか?

要するに、計算方法が違ったのです。

これらを心臓患者データに適用して、深層学習と機械学習におけるその威力を見てみましょう。

次に、正則化を適用して心臓患者データを分析し、正則化の力を確認します。データセットには次からアクセスできます。こちら.

機械学習を適用するには、Scikit-learn を使用します。深層学習を適用するには、TensorFlow を使用します。はじめましょう！

機械学習における正則化

Scikit-learn は最も人気のあるものの 1 つです Pythonライブラリシンプルで効率的なデータ分析およびモデリングツールを提供する機械学習向け。

これには、特に線形モデル向けのさまざまな正則化手法の実装が含まれています。

ここでは、L1 (なげなわ) と L2 (リッジ) の正則化を適用する方法を検討します。

次のコードでは、Ridge(L2) および Lasso 正則化 (L1) 手法を使用してロジスティック回帰をトレーニングします。最後に詳細なレポートを見ていきます。コードを見てみましょう。

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

# Assuming heart_data is already loaded
X = heart_data.drop('target', axis=1)
y = heart_data['target']

# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Standardize the features
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Define regularization values to explore
regularization_values = [0.001, 0.01, 0.1]

# Placeholder for storing performance metrics
performance_metrics = []

# Iterate over regularization values for L1 and L2
for C_value in regularization_values:
    # Train and evaluate L1 model
    log_reg_l1 = LogisticRegression(penalty='l1', C=C_value, solver='liblinear')
    log_reg_l1.fit(X_train_scaled, y_train)
    y_pred_l1 = log_reg_l1.predict(X_test_scaled)
    accuracy_l1 = accuracy_score(y_test, y_pred_l1)
    report_l1 = classification_report(y_test, y_pred_l1)
    performance_metrics.append(('L1', C_value, accuracy_l1))
    
    # Train and evaluate L2 model
    log_reg_l2 = LogisticRegression(penalty='l2', C=C_value, solver='liblinear')
    log_reg_l2.fit(X_train_scaled, y_train)
    y_pred_l2 = log_reg_l2.predict(X_test_scaled)
    accuracy_l2 = accuracy_score(y_test, y_pred_l2)
    report_l2 = classification_report(y_test, y_pred_l2)
    performance_metrics.append(('L2', C_value, accuracy_l2))

# Print the performance metrics for all models
print("Model Performance Evaluation:")
print("--------------------------------")
for metric in performance_metrics:
    reg_type, C_value, accuracy = metric
    print(f"Regularization: {reg_type}, C: {C_value}, Accuracy: {accuracy:.2f}")

これが出力です。

一体、正則化とは何ですか?

結果を評価してみましょう。

L1正則化

C=0.001 では、精度が著しく低くなります (48%)。これは、モデルがアンダーフィッティングであることを示しています。正則化が多すぎることがわかります。
C が 0.01 に増加しても、L1 の精度は変化せず、モデルが依然としてアンダーフィッティングに苦しんでいるか、正則化が強すぎることを示唆しています。
C=0.1 では、精度が 87% に大幅に向上し、正則化強度を下げることでモデルがデータからより適切に学習できることがわかります。

L2正則化

全体として、L2 正則化は一貫して良好なパフォーマンスを示し、C=87 の場合は 0.001% の精度、C=89 の場合は 0.01% とわずかに高く、C=87 の場合は 0.1% で安定します。

これは、潜在的にその性質により、ロジスティック回帰モデルにおけるこのデータセットに対して、L2 正則化が一般的により寛容で効果的であることを示唆しています。

深層学習における正則化

深層学習では、L1 (Lasso) および L2 (Ridge) 正則化、ドロップアウト、早期停止など、いくつかの正則化手法が使用されます。

この例では、前の機械学習の例で行ったことを繰り返すために、L1 と L2 の正則化を適用します。今回はL1とL2の正則化値のリストを定義してみましょう。

次に、これらすべての値について深層学習モデルをトレーニングして評価し、最後に結果を評価します。

コードを見てみましょう。

from tensorflow.keras.regularizers import l1_l2
import numpy as np

# Define a list/grid of L1 and L2 regularization values
l1_values = [0.001, 0.01, 0.1]
l2_values = [0.001, 0.01, 0.1]

# Placeholder for storing performance metrics
performance_metrics = []

# Iterate over all combinations of L1 and L2 values
for l1_val in l1_values:
    for l2_val in l2_values:
        # Define model with the current combination of L1 and L2
        model = Sequential([
            Dense(128, activation='relu', input_shape=(X_train_scaled.shape[1],), kernel_regularizer=l1_l2(l1=l1_val, l2=l2_val)),
            Dropout(0.5),
            Dense(64, activation='relu', kernel_regularizer=l1_l2(l1=l1_val, l2=l2_val)),
            Dropout(0.5),
            Dense(1, activation='sigmoid')
        ])
        
        model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
        
        # Train the model
        history = model.fit(X_train_scaled, y_train, validation_split=0.2, epochs=100, batch_size=10, verbose=0)
        
        # Evaluate the model
        loss, accuracy = model.evaluate(X_test_scaled, y_test, verbose=0)
        
        # Store the performance along with the regularization values
        performance_metrics.append((l1_val, l2_val, accuracy))

# Find the best performing model
best_performance = max(performance_metrics, key=lambda x: x[2])
best_l1, best_l2, best_accuracy = best_performance

# After the loop, to print all performance metrics
print("All Model Performances:")
print("L1 Value | L2 Value | Accuracy")
for metrics in performance_metrics:
    print(f"{metrics[0]:8} | {metrics[1]:8} | {metrics[2]:.3f}")

# After finding the best performance, to print the best model details
print("nBest Model Performance:")
print("----------------------------")
print(f"Best L1 value: {best_l1}")
print(f"Best L2 value: {best_l2}")
print(f"Best accuracy: {best_accuracy:.3f}")

これが出力です。

一体、正則化とは何ですか?

深層学習モデルのパフォーマンスは、L1 正則化値と L2 正則化値の組み合わせが異なるとさらに大きく異なります。

L1=0.01 および L2=0.001 で最高のパフォーマンスが観察され、精度は 88.5% です。これは、モデルがデータ内の基礎となるパターンをキャプチャできるようにしながら、過学習を防止するバランスの取れた正則化を示しています。

正則化値が高くなると、特に L1=0.1 または L2=0.1 では、モデルの精度が 52.5% まで大幅に低下します。これは、正則化が多すぎるとモデルの学習能力が大幅に制限されることを示唆しています。

正則化における機械学習と深層学習

機械学習と深層学習の結果を比較してみましょう。

正則化の効果: 機械学習と深層学習の両方のコンテキストにおいて、適切な正則化は過剰適合の軽減に役立ちますが、過剰な正則化は過小適合につながります。最適な正則化の強度は異なりますが、深層学習モデルは複雑であるため、より微妙なバランスが必要になる可能性があります。

パフォーマンス： 最もパフォーマンスの高い機械学習モデル (L2、C=0.01、精度 89%) と最もパフォーマンスの高い深層学習モデル (L1=0.01、L2=0.001、精度 88.5%) は同等の精度を達成しており、両方のアプローチが効果的に利用できることを示しています。このデータセットで高いパフォーマンスを達成するために正規化されています。

正則化戦略: L2 正則化はより効果的で、ロジスティック回帰モデルにおける C の選択の影響を受けにくいように見えますが、L1 正則化と L2 正則化を組み合わせるとディープラーニングで最良の結果が得られ、特徴選択と重みペナルティのバランスが取れます。

正則化の選択と強度は、学習の複雑さと過学習または過小学習のリスクのバランスを保つために慎重に調整する必要があります。

この探索を通じて、私たちは正則化の謎を解き明かし、過学習を防止し、モデルが目に見えないデータに対して適切に一般化できるようにするその役割を示しました。

正則化手法を適用すると、機械学習と深層学習の熟練度に近づき、データサイエンティストのツールセットが強化されます。

データプロジェクトに進み、次のようなさまざまなシナリオでデータを正規化してみてください。配信期間の予測。このデータプロジェクトでは、機械学習モデルと深層学習モデルの両方を使用しました。ただし、最終的には改善の余地があるかもしれないとも述べました。それで、そこで正則化を試してみて、それが役立つかどうかを確認してみてはいかがでしょうか?

ネイト・ロシディ データサイエンティストであり、製品戦略に携わっています。彼はまた、分析を教える非常勤教授であり、ストラタスクラッチ、データサイエンティストがトップ企業からの実際の面接の質問で面接の準備をするのを支援するプラットフォーム。彼とつながる Twitter：StrataScratch or LinkedIn.

このトピックの詳細

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://www.kdnuggets.com/wtf-is-regularization-and-what-is-it-for?utm_source=rss&utm_medium=rss&utm_campaign=wtf-is-regularization-and-what-is-it-for

タイムスタンプ： 2024 年 3 月 8 日

タイムスタンプ： 2022 年 12 月 14 日

生成型 AI の時代でもデータサイエンティストは必要ですか? – KDnuggets

ソースクラスター：

KDナゲット

ソースノード： 2144053

タイムスタンプ： 2023 年 6 月 22 日

脳ニューロンをシミュレートするには、いくつのAIニューロンが必要ですか？

ソースクラスター：

KDナゲット

ソースノード： 1083658

タイムスタンプ： 2021 年 9 月 13 日

一体、正則化とは何ですか? – KDnuggets

プラトン再発行

機械学習における正則化

L1正則化

L2正則化

深層学習における正則化

正則化における機械学習と深層学習

このトピックの詳細

より多くの KDナゲット

生成 AI をマスターするための DataCamp コーストップ 5 – KDnuggets

2024 年のトップ無料データサイエンスオンラインコース – KDnuggets

4 日以内に就職できるようになる 30 つの認定 – KDnuggets

機械学習における前処理の重要性

機械学習の評価指標: 理論と概要 – KDnuggets

GPT-3 と Gemini を破壊したばかりの Claude 4 Opus を始める – KDnuggets

KDnuggets ニュース、13 月 5 日: データサイエンスをマスターするための XNUMX つのスーパーチートシート • データサイエンスのための Google の NotebookLM の使用: 包括的なガイド – KDnuggets

準同型暗号による暗号化データの感情分析

生成型 AI の時代でもデータサイエンティストは必要ですか? – KDnuggets

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー