狄利克雷分布:一种定义在“概率向量”上的多元连续分布(各分量非负且总和为 1)。它常用作分类/多项分布(Categorical/Multinomial)参数的先验分布,在贝叶斯统计与机器学习中非常常见;其参数(常记为 α)会影响概率向量的稀疏或均匀程度。(该术语在不同教材中也会进一步讨论其作为“共轭先验”的性质。)
/dɪˈriːkleɪ ˌdɪstrɪˈbjuːʃən/
A Dirichlet distribution is often used as a prior over probabilities.
狄利克雷分布常被用作概率的先验分布。
In topic modeling, a Dirichlet distribution can control how sparse each document’s topic proportions are.
在主题模型中,狄利克雷分布可以控制每篇文档的主题比例有多“稀疏”(更偏向少数主题)或更“均匀”。
“Dirichlet” 来自 19 世纪德国数学家 Peter Gustav Lejeune Dirichlet(狄利克雷) 的姓氏,许多数学对象以他命名;“distribution” 源自拉丁语系词根,表示“分配、分布”。合起来指“以狄利克雷命名的分布”。