線形回帰とロジスティック回帰の違い - との差

線形回帰とロジスティック回帰の違い

主な違い 線形回帰とロジスティック回帰の間には 線形回帰は連続値の予測に使用され、ロジスティック回帰は離散値の予測に使用されます。

機械学習システムは過去のインプットのトレーニングに基づいて将来の結果を予測することができます。機械学習には、教師あり学習と教師なし学習という2つの主要な種類があります。回帰と分類は教師あり学習に分類され、クラスタリングは教師なし学習に分類されます。教師付き学習アルゴリズムは、ラベル付きデータを使用してデータセットを訓練します。線形回帰とロジスティック回帰は、2種類の教師あり学習アルゴリズムです。従属変数が連続的で、モデルが線形の場合、線形回帰が使用されます。従属変数が離散的で、モデルが非線形の場合、ロジスティック回帰が使用されます。

カバーする主な分野

1.線形回帰とは
- 定義、機能
ロジスティック回帰とは
- 定義、機能
線形回帰とロジスティック回帰の違い
- 主な違いの比較

主な用語

線形回帰、ロジスティック回帰、機械学習


線形回帰とは

線形回帰は、独立変数と従属変数の間の関係を見つけます。どちらも隣接しています。独立変数は、他の変数によって変更されない変数です。これはxで表されます。 x1、x2、x3などの複数の独立変数もあります。従属変数は独立変数に従って変化し、yで表されます。

独立変数が1つの場合、回帰式は次のようになります。

y = b0 + b1x

たとえば、xが降雨量を表し、yが収穫量を表すとします。


図1:線形回帰

データセットは上記のようになります。次に、ほとんどのデータポイントをカバーする線が選択されます。この線は予測値を表します。


図2:実際のデータ点と予測値との間の距離

次に、上のグラフに示すように、各データポイントから線までの距離を求めます。これは、実際の値と予測値の間の距離です。この距離は誤差または残差としても知られています。最良適合線は、誤差の二乗和の最小値を持つべきです。新しい降雨値が与えられると(x)、この線を使って対応する収穫量(y)を見つけることができます。

現実の世界では、複数の独立変数(x 1、x 2、x 3…)が存在する可能性があります。これは重回帰分析と呼ばれます。重回帰式は次の通りです。

ロジスティック回帰とは

ロジスティック回帰は、2つのクラスを分類するために使用できます。それはまたとして知られています バイナリ分類 Eメールがスパムであるかどうかをチェックするか、顧客が商品を購入するかどうかを予測しない、プロモーションを受けることができるかどうかを予測する、などのロジスティック回帰の他の例があります。


図3:ロジスティック回帰

一日に生徒が勉強した時間数が独立変数であると仮定します。それに応じて、試験に合格する確率が計算されます。値0.5がしきい値と見なされます。新しい時間数が与えられると、このグラフを使用して試験に合格する対応する確率を見つけることができます。確率が0.5を超える場合は、1または合格と見なされます。確率が0.5未満の場合は、0または失敗と見なされます。

シグモイド関数に線形回帰式を適用すると、ロジスティック回帰式が得られます。

シグモイド関数は


注意すべきもう1つの重要な点は、ロジスティック回帰は2つのクラスを分類するためにのみ適用可能であるということです。マルチクラス分類には使用されません。

線形回帰とロジスティック回帰の違い

定義

線形回帰は、従属変数と1つ以上の独立変数の間の関係をモデル化する線形アプローチです。対照的に、ロジスティック回帰は2つの値しか持てない結果の確率を予測する統計モデルです。

使用法

線形回帰は回帰問題を解くのに使われますが、ロジスティック回帰は分類問題を解くのに使われます(二項分類)。

方法論

線形回帰は、独立変数に変化があるときに従属変数を推定します。ロジスティック回帰は、イベントが発生する可能性を計算します。これは線形回帰とロジスティック回帰の間の1つの重要な違いです。

出力値

また、線形回帰では、出力値は連続的です。ロジスティック回帰では、出力値は離散的です。

モデル

線形回帰は直線を使用しますが、ロジスティック回帰はS曲線またはシグモイド関数を使用します。これは、線形回帰とロジスティック回帰の間のもう1つの重要な違いです。

国のGDPの予測、製品の価格の予測、住宅の販売価格の予測、スコアの予測は、線形回帰の例です。電子メールがスパムかどうかを予測し、クレジットカード取引が不正であるかどうかを予測し、顧客が融資を受けるかどうかを予測することは、ロジスティック回帰の例です。

結論

線形回帰とロジスティック回帰の違いは、線形回帰は連続値の予測に使用され、ロジスティック回帰は離散値の予測に使用されることです。簡単に言えば、線形回帰は回帰に使用され、ロジスティック回帰は分類に使用されます。

参照:

線形回帰分析Pythonでの線形回帰機械学習アルゴリズムSimplilearn、2018年3月26日、