我已经实现了一个用于搜索图像内部图案的软件。使用cvMatchTemplate时,执行时间约为10ms(因为我在120x160像素的搜索窗口中采用40x40的模式。图像为640x480,所以我没有考虑整个图像)。
我已经通过使用gpu::MatchTemplate实现了相同的算法,并且期待执行时间的改善。计算分数需要220毫秒。
怎么了?
谢谢。
编辑:我测量了图像的加载时间,因为“图像已被解压缩,”执行“.upload”功能需要1毫秒。
是不是同一算法?
编辑:我使用CUDA和我自己的内核编写了代码:它使用cuda函数在图像上执行FFT,并且对于1024x1024图像和200x200模式,算法的整个执行时间不到2毫秒。
我使用thread_sync来测量exec。时间。
最佳答案
我认为这很大程度上取决于您的GPU处理能力,某些GPU的性能无法比CPU更好。
看到这个问题gpuvscpu