贝叶斯派 先验分布、后验分布、似然分布、似然估计,通俗解释

先验分布、后验分布、似然分布三个应该在一起,似然估计应该分开。

前三个一起出现在贝叶斯公式,

$\theta$是分布参数,$X$是所见数据,
$P(\theta|X)$是后验,即见过数据$X$影响后的分布;
$P(\theta)$是先验,没受$X$影响前的分布;
$P(X|\theta)$是似然,即在已知分布参数$\theta$下,度量生成某个样本/事件的分布

===================================
而后面的似然估计,是参数估计的思想,是求参的思想。一般都是极大似然估计,也就是怎样改变参数才能使得分布的结果更加符合所观测的数据(或者说训练数据),而具体的方法有有:

  1. 贝叶斯估计,也就是上述的朴素贝叶斯
  2. ( 解析解的)极大似然估计,一般求解是:

    求最大似然函数估计值的一般步骤:
    (1)写出似然函数;
    (2)对似然函数取对数,并整理;
    (3)求导数,令导数为0,得到似然方程;
    (4)解似然方程,得到的参数即为所求;

  3. 期望最大(EM)方法,即没办法求解析解的参数估计
  4. 以及很多深度学习加持的模型