生成模型和判别模型

生成模型和判别模型

Posted by LmYjQ on January 4, 2018

一、 定义

1. 判别模型

有特征x,有预测目标y,直接建模p(y|x),即:给定每个特征取值,直接算出等于预测目标的概率

比如:给定体重/颜色/喜欢吃的东西,直接预测动物类别

2. 生成模型

建模p(x|y)和p(y),通过贝叶斯公式(p(y | x)=\frac{p(x | y) p(y)}{p(x)})计算p(y|x)

比如:先计算每种动物的(体重/颜色/喜欢吃的东西)分布和动物类别的分布(稀有程度),再计算动物处于每一种类别的概率分布

二、举例

1. Gaussian Discriminant Analysis (GDA) model

y服从伯努利分布 x服从多维高斯分布

极大似然求解

得到参数值

和LR逻辑回归的关系

GDA有更强的假设(高斯分布),用较少的数据即可拟合 LR假设弱,鲁棒性强,大数据下效果好 GDA可以转化成LR,但反之不可以

2. NaiveBayes朴素贝叶斯

朴素假设:每个xi都和其他xi独立,概率连乘形式简单

求得每个参数值