在我的程序中,k均值算法取k=2,也就是说,我只需要2个簇。
我已经以一种非常简单和直接的方式实现了,但我仍然无法理解为什么我的程序会进入无限循环。
有人能告诉我哪里出错了吗。。?
为了简单起见,我已经在程序代码中接受了输入。
这是我的代码:
import java.io.*;
import java.lang.*;
class Kmean
{
public static void main(String args[])
{
int N=9;
int arr[]={2,4,10,12,3,20,30,11,25}; // initial data
int i,m1,m2,a,b,n=0;
boolean flag=true;
float sum1=0,sum2=0;
a=arr[0];b=arr[1];
m1=a; m2=b;
int cluster1[]=new int[9],cluster2[]=new int[9];
for(i=0;i<9;i++)
System.out.print(arr[i]+ "\t");
System.out.println();
do
{
n++;
int k=0,j=0;
for(i=0;i<9;i++)
{
if(Math.abs(arr[i]-m1)<=Math.abs(arr[i]-m2))
{ cluster1[k]=arr[i];
k++;
}
else
{ cluster2[j]=arr[i];
j++;
}
}
System.out.println();
for(i=0;i<9;i++)
sum1=sum1+cluster1[i];
for(i=0;i<9;i++)
sum2=sum1+cluster2[i];
a=m1;
b=m2;
m1=Math.round(sum1/k);
m2=Math.round(sum2/j);
if(m1==a && m2==b)
flag=false;
else
flag=true;
System.out.println("After iteration "+ n +" , cluster 1 :\n"); //printing the clusters of each iteration
for(i=0;i<9;i++)
System.out.print(cluster1[i]+ "\t");
System.out.println("\n");
System.out.println("After iteration "+ n +" , cluster 2 :\n");
for(i=0;i<9;i++)
System.out.print(cluster2[i]+ "\t");
}while(flag);
System.out.println("Final cluster 1 :\n"); // final clusters
for(i=0;i<9;i++)
System.out.print(cluster1[i]+ "\t");
System.out.println();
System.out.println("Final cluster 2 :\n");
for(i=0;i<9;i++)
System.out.print(cluster2[i]+ "\t");
}
}
最佳答案
你有很多错误:
在do
循环开始时,您应该将sum1
和sum2
重置为0。
在计算k
和j
时,应分别循环到sum1
和sum2
(或在cluster1
循环开始时清除cluster2
和do
。
在计算sum2
时,您意外地使用了sum1
。
当我进行这些修复时,代码运行良好,产生以下输出:
Final cluster 1 :
2 4 10 12 3 11 0 0 0
Final cluster 2 :
20 30 25 0 0 0 0 0 0
我的一般建议是:学习如何使用调试器stackoverflow不适用于这样的问题:它期望您能找到自己的bug,并且只有在其他所有问题都失败时才来这里……
关于java - k均值聚类算法的实现,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21111070/