最优二叉搜索树 |

定义

设是有序集，且，表示有序集 S 的二叉搜索树利用二叉树的结点来存储有序集中的元素。它具有下述性质：存储于每个结点中的元素 x 大于其左子树中任一结点所存储的元素，小于其右子树中任一结点所存储的元素。二叉搜索树的叶节点是形如的开区间。在表示 S 的二叉搜索树中搜索一个元素 x ，返回的结果有两种情况：

① 在二叉搜索树的内结点中找到，令其概率为

② 在二叉搜索树的叶节点中确定，令其概率为。表示 x 小于的值的概率，表示所有 x 大于的值的概率，表示 x 位于和值的概率。

显然，有，，，称为集合 S 的存取概率分布。

在表示 S 的二叉搜索树 T 中，设存储元素的结点深度为，叶节点的结点深度为，则

表示在二叉搜索树 T 中进行一次搜索所需的平均比较次数，p又称为二叉搜索树 T 的平均路长。在一般情况下，不同的二叉搜索树的平均路上是不相同的。

所以，最优二叉搜索树问题是对于有序集 S 及其存取概率分布，在所有表示有序集 S 的二叉搜索树中找出一颗具有最小平均路长的二叉搜索树。

最优子结构性质

二叉搜索树 T 的一棵含有结点和叶节点的子树可以看做是有序集关于全集合的一棵二叉搜索树，其存取概率为下面的条件概率

设是有序集关于存取概率的一棵最优二叉搜索树，其平均路长为。的根结点存储元素。其左右子树和的平均路长分别为和。由于和中结点深度是他们在中的结点深度减1，所以得出

由于是关于集合的一棵二叉搜索树，故。若，则用替换可得到平均路长比更小的二叉搜索树。这与是最优二叉搜索树矛盾。故是一棵最优二叉搜索树。同理，也是一棵最优二叉搜索树。

因此最优二叉搜索树问题具有最优子结构性质。

实现

#include <iostream>
using namespace std;
const int MaxVal=9999,n=5;
double p[n+1] = {-1,0.15,0.1,0.05,0.1,0.2};  //搜索到内部节点的概率  
double q[n+1] = {0.05,0.1,0.05,0.05,0.05,0.1};  //搜索到虚拟键的概率  
int root[n+1][n+1];  //记录根节点  
double w[n+2][n+2];  //子树概率总和  
double e[n+2][n+2];  //子树期望代价  
void optimalBST(int n)
{
    int i,j,k,len;
    for (i=1;i<=n+1;++i)
    {
        w[i][i-1]=q[i-1];
        e[i][i-1]=q[i-1];
    }
    for(len=1;len<=n;++len)
    {
        for(i=1;i<=n-len+1;++i)
        {
            j=i+len-1;
            e[i][j]=MaxVal;
            w[i][j]=w[i][j-1]+p[j]+q[j];
            for(k=i;k<=j;++k)
            {
                double temp=e[i][k-1]+e[k+1][j]+w[i][j];
                if (temp<e[i][j])
                {
                    e[i][j]=temp;
                    root[i][j]=k;
                }
            }
        }
    }
}
void printOptimalBST(int i,int j,int r)
{
    int rootChild = root[i][j];
    if (rootChild == root[1][n])
    {
        printf("k%d 是根\n",rootChild);
        printOptimalBST(i,rootChild - 1,rootChild);
        printOptimalBST(rootChild + 1,j,rootChild);
        return;
    }
    if (j < i - 1)  return;
    else if (j == i - 1)
    {
        if (j < r)  printf("d%d 是 k%d 的左孩子\n",j,r);
        else  printf("d%d 是 k%d 的右孩子\n",j,r);
        return;
    }
    else
    {
        if (rootChild < r)  printf("k%d 是 k%d 的左孩子\n",rootChild,r);
        else  printf("k%d 是 k%d 的左孩子\n",rootChild,r);
    }
    printOptimalBST(i,rootChild - 1,rootChild);
    printOptimalBST(rootChild + 1,j,rootChild);
}

int main()
{
    optimalBST(n);
    cout << "最优二叉树结构：" << endl;
    printOptimalBST(1,n,-1);
    system("pause");
    return 0;
}