我正在尝试使用存储在OpenCV Mat中的输入图像来使用VLFeat库的vl_slic_segment函数。我的代码正在编译并运行,但是输出的超像素值没有意义。到目前为止,这是我的代码:

Mat bgrUChar = imread("/pathtowherever/image.jpg");

Mat bgrFloat;
bgrUChar.convertTo(bgrFloat, CV_32FC3, 1.0/255);
cv::Mat labFloat;
cvtColor(bgrFloat, labFloat, CV_BGR2Lab);

Mat labels(labFloat.size(), CV_32SC1);
vl_slic_segment(labels.ptr<vl_uint32>(),labFloat.ptr<const float>(),labFloat.cols,labFloat.rows,labFloat.channels(),30,0.1,25);

我尝试不将其转换为Lab色彩空间并设置不同的regionSize/regularization,但是输出总是非常小故障。我能够正确检索标签值,但事实是每个标签通常散布在一个不连续的区域上。

我认为问题是输入数据的格式错误,但是我不知道如何将其正确发送到vl_slic_segment函数。

先感谢您!

编辑

大卫,谢谢您,正如您帮助我理解的那样,vl_slic_segment希望数据按[LLLLLAAAAABBBBBBB]排序,而OpenCV正在为LAB颜色空间排序其数据[LABLABLABLABLAB]。

最佳答案

在我的学士论文过程中,我还必须使用VLFeat的SLIC实现。您可以在GitHub上的Lenna.png上找到一个应用VLFeat的SLIC的简短示例:https://github.com/davidstutz/vlfeat-slic-example

也许看看main.cpp可以帮助您弄清楚如何将OpenCV获得的图像转换为正确的格式:

// OpenCV can be used to read images.
#include <opencv2/opencv.hpp>

// The VLFeat header files need to be declared external.
extern "C" {
    #include "vl/generic.h"
    #include "vl/slic.h"
}

int main() {
    // Read the Lenna image. The matrix 'mat' will have 3 8 bit channels
    // corresponding to BGR color space.
    cv::Mat mat = cv::imread("Lenna.png", CV_LOAD_IMAGE_COLOR);

    // Convert image to one-dimensional array.
    float* image = new float[mat.rows*mat.cols*mat.channels()];
    for (int i = 0; i < mat.rows; ++i) {
        for (int j = 0; j < mat.cols; ++j) {
            // Assuming three channels ...
            image[j + mat.cols*i + mat.cols*mat.rows*0] = mat.at<cv::Vec3b>(i, j)[0];
            image[j + mat.cols*i + mat.cols*mat.rows*1] = mat.at<cv::Vec3b>(i, j)[1];
            image[j + mat.cols*i + mat.cols*mat.rows*2] = mat.at<cv::Vec3b>(i, j)[2];
        }
    }

    // The algorithm will store the final segmentation in a one-dimensional array.
    vl_uint32* segmentation = new vl_uint32[mat.rows*mat.cols];
    vl_size height = mat.rows;
    vl_size width = mat.cols;
    vl_size channels = mat.channels();

    // The region size defines the number of superpixels obtained.
    // Regularization describes a trade-off between the color term and the
    // spatial term.
    vl_size region = 30;
    float regularization = 1000.;
    vl_size minRegion = 10;

    vl_slic_segment(segmentation, image, width, height, channels, region, regularization, minRegion);

    // Convert segmentation.
    int** labels = new int*[mat.rows];
    for (int i = 0; i < mat.rows; ++i) {
        labels[i] = new int[mat.cols];

        for (int j = 0; j < mat.cols; ++j) {
            labels[i][j] = (int) segmentation[j + mat.cols*i];
        }
    }

    // Compute a contour image: this actually colors every border pixel
    // red such that we get relatively thick contours.
    int label = 0;
    int labelTop = -1;
    int labelBottom = -1;
    int labelLeft = -1;
    int labelRight = -1;

    for (int i = 0; i < mat.rows; i++) {
        for (int j = 0; j < mat.cols; j++) {

            label = labels[i][j];

            labelTop = label;
            if (i > 0) {
                labelTop = labels[i - 1][j];
            }

            labelBottom = label;
            if (i < mat.rows - 1) {
                labelBottom = labels[i + 1][j];
            }

            labelLeft = label;
            if (j > 0) {
                labelLeft = labels[i][j - 1];
            }

            labelRight = label;
            if (j < mat.cols - 1) {
                labelRight = labels[i][j + 1];
            }

            if (label != labelTop || label != labelBottom || label!= labelLeft || label != labelRight) {
                mat.at<cv::Vec3b>(i, j)[0] = 0;
                mat.at<cv::Vec3b>(i, j)[1] = 0;
                mat.at<cv::Vec3b>(i, j)[2] = 255;
            }
        }
    }

    // Save the contour image.
    cv::imwrite("Lenna_contours.png", mat);

    return 0;
}

此外,请查看GitHub存储库中的README.md。下图显示了将正则化设置为1(100,1000)并将区域大小设置为30(20,40)的一些示例输出。

图1:将区域大小设置为30,将正则化设置为1的超像素分割。

图2:将区域大小设置为30,将正则化设置为100的超像素分割。

图3:将区域大小设置为30,将正则化设置为1000的超像素分割。

图4:超像素分割,区域大小设置为20,正则化设置为1000。

图5:超像素分割,区域大小设置为20,正则化设置为1000。

关于c++ - OpenCV VLFeat Slic函数调用,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24403743/

10-13 05:41