我正在着手进行一些我认为可能是实验性的工作...

要想出(或发现可能已经存在的)一种方法来确定给定的图像文件(无论格式如何)是照片还是图形。

“照片”是指风景,人物等。 “图形”表示图标,插图,图表,UI屏幕截图等。

在过去的一周中,我想到了一个不错的PHP/ImageMagick脚本,该脚本从图像文件中提取统计数据,并将修复程序很好地应用于白平衡,色调,鲜明度,清晰度,阴影/高光。

现在,我想更进一步:自动检测照片内容,然后应用上述处理。

到目前为止,一种已在某种程度上保持一致的方法是确定图像是否具有EXIF数据,但这仅适用于JPEG。当然,这并不是万无一失的。

是否有通过ImageMagick,GD或其他方式检测“照片”与“图形”的已知方法?

如果需要,除了ImageMagick和GD之外,我确实具有在我们的Web服务器上安装/运行应用程序的功能。

谢谢!

最佳答案

照片中往往带有不同颜色(千,万和十万)的 LOT 。其他图形倾向于使用有限数量的独特颜色(多达数百种)。

因此,ImageMagick命令可能能够帮助分类大量文件:

 identify -format '%k\n'        file
 identify -format '%f :  %k\n'  file1 file2 file3 file4

IM特殊%k IM identify百分比转义宏会导致对identify ed文件中唯一颜色的数量进行计数和返回。以下是我自己的本地文件的一些示例:
 identify -format '%k' logo.png
    257

 identify -format '%k' testimage.png
  20913

对本地目录中的一组15张4032x3024大小的照片运行它会产生以下结果(每张照片花费2秒以上的时间来计算颜色):
time identify -format '%f :  %k\n' *.JPG
  P4061782.JPG :  285127
  P4061783.JPG :  304247
  P4061784.JPG :  230241
  P4061785.JPG :  277545
  P4061786.JPG :  300632
  P4061787.JPG :  325916
  P4061788.JPG :  301766
  P4061789.JPG :  300821
  P4061790.JPG :  265080
  P4061791.JPG :  348247
  P4101941.JPG :  323714
  P4101942.JPG :  359688
  P4101943.JPG :  338563
  P4101944.JPG :  308578
  P4101945.JPG :  291853

   real  0m34.257s
   user  0m33.301s
   sys   0m0.678s

警告:使用矢量绘图应用程序(例如inkscape)生成的复杂渐变可能还会产生许多独特的颜色...

10-06 14:03
查看更多