一、 定义
1. 判别模型
有特征x,有预测目标y,直接建模p(y|x),即:给定每个特征取值,直接算出等于预测目标的概率
比如:给定体重/颜色/喜欢吃的东西,直接预测动物类别
2. 生成模型
建模p(x|y)和p(y),通过贝叶斯公式(p(y | x)=\frac{p(x | y) p(y)}{p(x)})计算p(y|x)
比如:先计算每种动物的(体重/颜色/喜欢吃的东西)分布和动物类别的分布(稀有程度),再计算动物处于每一种类别的概率分布
二、举例
1. Gaussian Discriminant Analysis (GDA) model
y服从伯努利分布 x服从多维高斯分布
极大似然求解
得到参数值
和LR逻辑回归的关系
GDA有更强的假设(高斯分布),用较少的数据即可拟合 LR假设弱,鲁棒性强,大数据下效果好 GDA可以转化成LR,但反之不可以
2. NaiveBayes朴素贝叶斯
朴素假设:每个xi都和其他xi独立,概率连乘形式简单
求得每个参数值