Dirichlet process(狄利克雷过程,常缩写为 DP)是贝叶斯非参数统计中的一种随机概率分布(随机测度):它生成“一个分布的分布”。常用于聚类与混合模型中,在不预先固定簇(类别)数量的情况下,让模型根据数据自动推断复杂度(例如簇的个数)。
/dɪˈriːkleɪ/ /ˈproʊsɛs/
A Dirichlet process can model an unknown number of clusters.
狄利克雷过程可以用来建模未知数量的簇(类别)。
In Bayesian nonparametrics, a Dirichlet process mixture allows flexible density estimation without choosing the number of mixture components in advance.
在贝叶斯非参数方法中,狄利克雷过程混合模型能够进行灵活的密度估计,而无需事先决定混合成分的数量。
“Dirichlet”来自德国数学家Peter Gustav Lejeune Dirichlet(狄利克雷)的姓氏;“process”在这里指一种随机过程/随机机制。之所以得名,是因为它的边缘分布与Dirichlet distribution(狄利克雷分布)密切相关:在有限划分上,DP 诱导出的概率向量服从狄利克雷分布。