我正在尝试写一袋功能系统图像识别系统。该算法的第一步是获取大量的小图像补丁(例如7x7或11x11像素),然后尝试将它们聚类为看起来相似的组。我从图像中获取补丁,将其转换为灰度浮点图像补丁,然后尝试获取cvKMeans2为我聚类。我认为我在格式化输入数据以至于KMeans2返回一致结果时遇到问题。之前,我曾将KMeans用于2D和3D聚类,但49D聚类似乎是另一回事。
我一直在获取返回的簇 vector 的垃圾值,因此显然这是垃圾输入/垃圾输出类型的问题。另外,对于如此庞大的数据集,该算法的运行速度比我认为的要快。
在简单的memcpy下面的代码中,这只是我最近一次尝试以正确的格式获取输入数据,我花了一段时间使用内置的OpenCV函数,但是当您的基本类型为CV_32FC(49)时,这很困难。
OpenCV 1.1的KMeans算法可以支持这种高维分析吗?
有人知道从图像复制到K-Means输入矩阵的正确方法吗?
有人可以指出我可以使用的免费的非GPL KMeans算法吗?
这不是最好的代码,因为我只是想立即使事情工作:
std::vector<int> DoKMeans(std::vector<IplImage *>& chunks){
// the size of one image patch, CELL_SIZE = 7
int chunk_size = CELL_SIZE*CELL_SIZE*sizeof(float);
// create the input data, CV_32FC(49) is 7x7 float object (I think)
CvMat* data = cvCreateMat(chunks.size(),1,CV_32FC(49) );
// Create a temporary vector to hold our data
// we'll copy into the matrix for KMeans
int rdsize = chunks.size()*CELL_SIZE*CELL_SIZE;
float * rawdata = new float[rdsize];
// Go through each image chunk and copy the
// pixel values into the raw data array.
vector<IplImage*>::iterator iter;
int k = 0;
for( iter = chunks.begin(); iter != chunks.end(); ++iter )
{
for( int i =0; i < CELL_SIZE; i++)
{
for( int j=0; j < CELL_SIZE; j++)
{
CvScalar val;
val = cvGet2D(*iter,i,j);
rawdata[k] = (float)val.val[0];
k++;
}
}
}
// Copy the data into the CvMat for KMeans
// I have tried various methods, but this is just the latest.
memcpy( data->data.ptr,rawdata,rdsize*sizeof(float));
// Create the output array
CvMat* results = cvCreateMat(chunks.size(),1,CV_32SC1);
// Do KMeans
int r = cvKMeans2(data, 128,results, cvTermCriteria(CV_TERMCRIT_EPS+CV_TERMCRIT_ITER, 1000, 0.1));
// Copy the grouping information to our output vector
vector<int> retVal;
for( int y = 0; y < chunks.size(); y++ )
{
CvScalar cvs = cvGet1D(results, y);
int g = (int)cvs.val[0];
retVal.push_back(g);
}
return retVal;}
提前致谢!
最佳答案
尽管我不熟悉“功能包”,但您是否考虑过使用拐角检测器和SIFT等功能点?
关于c++ - 高维空间中的OpenCV 1.1 K-Means聚类,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3128116/