拉普拉斯平滑

Laplace smoothing

在计算事件的概率时,如果某个事件在观察样本库(训练集)中没有出现过,会导致该事件的概率结果是0。这是不合理的,不能因为一个事件没有观察到,就被认为该事件一定不可能发生(即该事件的概率为0)

假定训练样本很大时,每个分量x的计数加 1 造成的估计概率变化可以忽略不计,但可以方便有效的避免零概率问题,这就是拉普拉斯平滑。

实际过程中通常设置为加一个超参数 λ[0,1]