SIFT图像特征检测的Python代码实现

  • Post author:
  • Post category:python


1.主要内容

利用Python调用VLFeat(


官方下载地址


)提供的SIFT接口对图像进行特征检测。如果CSDN中图片加载不出来,可移步知乎相关文章:

https://zhuanlan.zhihu.com/p/34890676

2.参考资料

主要参考资料为由朱文涛和袁勇翻译的《python 计算机视觉》原书为《ProgrammingComputer Vision with Python》,该书主要内容包括Harris和sift的特征检测、图像到图像的映射、图像聚类、基于BoW的图像检索等。译本作者提供了全书实现的python代码,电子书及代码可在译者


袁勇的个人主页


中获取,也可由以下百度网盘获取:

链接:


https://pan.baidu.com/s/1S2f1nbE6yMkEN6csH2-q1Q


密码:ishr

本文主要针对SIFT特征检测这一部分的代码进行了整理。

3.准备工作

从VLFeat下载的文件的子文件bin中将<vl.dll><vl.lib><sift.exe>三个文件拷贝出来,放到工程文件目录中


例如我的工程文件夹为../sift_python (程序sift.py所在文件夹),将上述三个文件拷贝到sift_python文件夹中。


4.代码

在工程文件中建立sift.py文件,将下述代码依次拷贝到sift.py文件中,在进行过简单的路径修改后即可运行。

以下为具体代码及注释:

4.1 相关库的导入

from PIL import Image
from numpy import *
from pylab import *
import os

4.2 SIFT调用函数的定义

(1) 利用PIL中的convert将图像转为灰度图

在PIL中,对于彩色图像,open后都会转换为“RGB”模式,然后该模式可以转换为其他模式,比如“1”、“L”、“P”和“RGBA”,这几种模式也可以转换为“RGB”模式。模式“RGB”转换为模式“1”以后,像素点变成黑白两种点,要么是0,要么是255。模式“RGB”转换为模式“L”以后,像素值为[0,255]之间的某个数值。模式“RGB”转换为模式“P”以后,像素值为[0,255]之间的某个数值,但它为调色板的索引值,其最终还是彩色图像。此处利用convert(‘L’) 将RGB图像转为灰度值范围为[0,255]的灰度图,并以.pgm格式保存

(2) 利用os.system()函数执行sift.exe文件,SIFT中相应的输入参数如下:


具体代码如下:

def process_image(imagename,resultname,params="--edge-thresh 10 --peak-thresh 5"):
    """ Process an image and save the results in a file. """

    if imagename[-3:] != 'pgm':
        # create a pgm file
        im = Image.open(imagename).convert('L')  #.convert('L') 将RGB图像转为灰度模式,灰度值范围[0,255]
        im.save('tmp.pgm')                       #将灰度值图像信息保存在.pgm文件中
        imagename = 'tmp.pgm'
   
    cmmd = str("E:\code\Sift\sift_python\sift.exe "+imagename+" --output="+resultname+
                " "+params)
    os.system(cmmd)                              #执行sift可执行程序,生成resultname(test.sift)文件
    print 'processed', imagename, 'to', resultname


4.3

其它函数的定义

def read_features_from_file(filename):
    """ Read feature properties and return in matrix form. """
    
    f = loadtxt(filename)
    return f[:,:4],f[:,4:] # feature locations, descriptors

filename即为生成的test.sift文件,其内部保存格式为:

上面数据的每一行前4 个数值依次表示兴趣点的坐标、尺度和方向角度,后面紧接着的是对应描述符的128 维向量。

def plot_features(im,locs,circle=True):
    """ Show image with features. input: im (image as array), 
        locs (row, col, scale, orientation of each feature). """

    def draw_circle(c,r):
        t = arange(0,1.01,.01)*2*pi
        x = r*cos(t) + c[0]
        y = r*sin(t) + c[1]
        plot(x,y,'b',linewidth=2)

    imshow(im)
    if circle:
        for p in locs:
            draw_circle(p[:2],p[2]) 
    else:
        plot(locs[:,0],locs[:,1],'ob')
    axis('off')

该函数在原始图像上使用蓝色的点绘制出SIFT 特征点的位置。将参数circle 的选项设置为True,该函数将使用draw_circle() 函数绘制出圆圈,圆圈的半径为特征的尺度。

4.4 主函数的定义

imname为待处理照片的路径,此处用的是绝对路径,此处更改为相应处理照片的路径即可:

if __name__ == '__main__':
    imname = ('E:\\code\\Sift\\library.jpg')               #待处理图像路径
    im=Image.open(imname)
    process_image(imname,'test.sift')
    l1,d1 = read_features_from_file('test.sift')           #l1为兴趣点坐标、尺度和方位角度 l2是对应描述符的128 维向
    figure()
    gray()
    plot_features(im,l1,circle = True)
    title('sift-features')
    show()


5.

运行结果

6.源代码下载

本文所涉及的代码及VLFeat相关文件均可在以下GitHub中获取:


https://github.com/ShawnWXS/SIFT-Python.git



版权声明:本文为wangxinsheng0901原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。