如何从Wordnet标准化相似性度量

如何规范单个度量

让我们考虑一个任意的相似度度量M并取一个任意的词w.

How to normalize a single measure

Let's consider a single arbitrary similarity measure M and take an arbitrary word w.

定义m = M(w,w).然后，m取最大可能值M.

Define m = M(w,w). Then m takes maximum possible value of M.

让我们将MN定义为标准化度量M.

Let's define MN as a normalized measure M.

对于任何两个单词w, u，您都可以计算MN(w, u) = M(w, u) / m.

For any two words w, u you can compute MN(w, u) = M(w, u) / m.

很容易看到，如果M采用非负值，那么MN采用[0, 1]中的值.

It's easy to see that if M takes non-negative values, then MN takes values in [0, 1].

为了计算自己定义的量度F，将k个不同的量度m_1, m_2, ..., m_k组合在一起，首先使用上述方法分别对每个m_i进行标准化，然后定义:

In order to compute your own defined measure F combined of k different measures m_1, m_2, ..., m_k first normalize independently each m_i using above method and then define:

alpha_1, alpha_2, ..., alpha_k

，使得alpha_i表示第i个小节的权重.

such that alpha_i denotes the weight of i-th measure.

所有字母的总和必须等于1，即:

All alphas must sum up to 1, i.e:

alpha_1 + alpha_2 + ... + alpha_k = 1

然后为w, u计算自己的度量:

Then to compute your own measure for w, u you do:

F(w, u) = alpha_1 * m_1(w, u) + alpha_2 * m_2(w, u) + ... + alpha_k * m_k(w, u)

很明显，F取[0,1]中的值

It's clear that F takes values in [0,1]

这篇关于如何从Wordnet标准化相似性度量的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持！

度量