在处理Dirichlet过程时,根据[Teh,2007],DP由基本概率H和比例因子“ alpha”定义
根据“杆断裂构造”,随机从DP抽出G:
G〜DP(α,H)
由:
G = sum(pi_k * delta_theta_k)在k上从1到无穷大
pi_k是从给定单一棒的长度的Beta分布中有序抽奖
delta_theta_k是以“ theta_k”为中心的点质量(theta_k是来自基本分布的随机绘制)
我几乎对所有变量都有清楚的了解,但是我不知道“质量点”是什么意思,是画画的概率密度,还是别的什么。
如果您可以将我指向任何方向,那将是很棒的,只有参考会很棒。
谢谢
最佳答案
G是概率分布上的概率分布。这些(子)概率分布在某个域上,我们称之为BigTheta。
每个theta_k均来自BigTheta上的分布,因此它是BigTheta的某些元素。
每个delta_theta_k是BigTheta上的一个概率分布,定义为delta_theta_k(theta_k)= 1且delta_theta_k(其他任何事物)=0。这就是他们所说的“点质量”分布,因为分布的所有质量都在一个以上域的点。
G是在BigTheta上的概率分布上的概率分布,定义为:对于称为f(由theta参数化)的BigTheta上的某些分布,G(f(theta))=和(pi_k * delta_theta_k(theta))。
我希望能有所帮助,我认为您通常有一个正确的主意,只是符号可能会变得有点复杂(因此,对于这种符号而言,SO并非最佳选择)。通常,当您遇到符号来思考它是什么类型的功能时(即定义了什么),通常会很有用。
关于machine-learning - Dirichlet过程中的Dirac Delta质量点,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/4013525/