基于深度学习的指纹识别方法研究_数码_

基于半监督学习的指纹识别方法的研究.pdf

陈虹旭李晓坤郑永亮袁烺邵娜杨磊刘磊

文章编号： 2095-2163（2018）03-0064-06中图分类号：文献标志码： A

摘要：关键词：（Heilongjiang Hengxun Technology Co. Ltd.， Harbin 150090， China）

Abstract： Modern science and technology is in a period of rapid development， fingerprint identification technology has been integrated into the various fields of social life. Among many biometric identification techniques， fingerprint recognition technology is widely used as one of the most intuitive technologies. There are some drawbacks in traditional fingerprint recognition technology， such as manually setting fingerprint features and multiple debugging. Design features and classifier selection are relatively difficult to achieve optimization， resulting in poor recognition rate. It is necessary to propose a scheme to improve the accuracy of fingerprint recognition. With the rise of machine learning technology in recent years， deep learning technology has become a hot topic at the moment. The combination of deep learning technology and biometric identification technology also has a bright future. Deep learning technology can learn and analyze in massive data. It can automatically identify， analyze and learn fingerprint characteristic data， thereby reduce manual workload， and improve the accuracy of fingerprint recognition. This paper introduces briefly the research status and existing problems of deep learning and fingerprint recognition technology， through convolution neural network has made the analysis and improvement on the fingerprint recognition technology based on the deep learning. In this paper， it is expected that the analysis and improvement of fingerprint identification technology will help people to understand the concept better and application of fingerprint identification， and promote the rapid development of biometric identification technology.

Key words：

基金項目：

作者简介：

通讯作者：收稿日期：

引言

当今社会，科学技术水平不断发展提高，标志着高速数字化信息时代的来临。大量的数据与信息充斥于人们日常生活的各个角落，面对数据与信息的群集涌入，人们对随之而来的风险与安全问题也日趋关注与重视。对于身份认证，人们试图设置多种多样的密码以保证数据的安全。具体来说，就是通过增加字母、数字、符号、区分大小写来提升密码的复杂度。可是这一举措却使得人们在管理密码方面陷入了困境：不同数据设置不同密码，密码体系已日渐庞大，密码遗忘或被破译会给人们带来数据与经济方面的双重损失，甚至可能引发更为严重的后果。

指纹识别是生物特征识别技术的主要方式之一。指纹是具有唯一性和高度辨识性的人体生物特征。很多人体生物特征还会随着年龄的变更而发生改变，但是指纹却呈现出与年龄无关的良好稳定性。纹理特征的复杂度使其能够成为人们身份认证的重要摄取方式。相对于其它生物特征，指纹在采集方面更加容易，而且易于保存和处理，采集成本也更低。指纹识别的推广性堪称良好，适应能力更强；而在采集时对于人体不会造成伤害，安全性极高；对于稳定性和可靠性方面也同样赢得了高度认定。人们只需要在电脑或者电子终端上增加一个指纹采集识别设备。现如今，指纹识别已经深入到了社会生活的多个层面，诸如：在公安领域，警方通过采集指纹信息来判断公民身份，并对出入境人员进行身份核实；在金融领域，银行通过指纹及证件对照核验客户身份，以实现银行卡的取现、转账等业务办理；在生活中，指纹识别技术已运用于电子设备管理、考勤管理、门禁管理等各类有关身份鉴定辨识的场景中。

指纹具有唯一性是在1880年由Fauld医生首次以专业的技术角度提出的，但却直到1892年才由Galton开创性地论述了指纹特征点的概念[1]。在1900年以后，司法机关正式对指纹赋予法律效力。1960年起，计算机替代了人工鉴证指纹时代。1980年，光学扫描技术运用到了指纹识别中。进一步地，研究推演到上世纪九十年代，指纹识别技术方面出现了相对准确的算法。学者Maio提出，可以通过对原始指纹灰度图像上的脊线进行提取，由此可成功获取图像特征[2]。传统的指纹识别算法是基于整幅指纹图像的全局增强处理的基础上研发得到的，而此后问世的新型识别算法的核心是针对图像的局部区域来进行增强处理，这就极大地提高了工作效率，有效减小了图像处理生成的冗余。在此基础上， Jiang又拓展提出了改进方法，通过自适应步长与细节点后续处理来综合提高运算速率[3]。

在指纹匹配领域进展中，来自不同国家的相关科研人员均纷纷贡献了各自不同的理论研究成果。以Jiang为首的学者提出了利用全局结构与局部结构的比对，从而进行匹配[4]。Isenor也发表了一种围绕图形形状等属性，从而进行匹配的算法[5]。经过此后的研究，Hrechak又探讨了一种致力于结构匹配的研究算法，從而取代了传统的图形识别匹配[6]。现如今，已获学界公认且得到广泛使用的算法是由FBI提出的基于指纹细节特征的匹配算法。就识别率而言，无论是基于结构匹配，或是基于图形匹配，相较于细节特征识别均处于劣势，因其不会随着图像的变形而更新结果，而且还对特征点的数量要求较高。

1数据来源

本文研究采用的数据库为NIST Special Database 4（NIST DB4）[7]的F库，NIST DB4F库是国际公开的用于指纹测试的数据库，其中包含了2 000张指纹图像。具体对应有斗、左旋、右旋、弓和帐弓各400张图像。

2指纹识别

指纹是指手指末端正面皮肤上形成的凹凸纹路，即谷和脊的部分。研究可知，指纹的唯一性是其重要性能，可通过这些纹路的方向与分布来突显特征，每根手指指纹纹线的相对位置、数量、方向都是不同的。并且，指纹还兼具稳定性，指纹的纹路不会随着个人年龄、体重的改变而发生变化。指纹采集图像的深色部分称为脊线，浅色部分称为谷线。指纹识别就是对脊线与谷线所组成的表面特征图进行比对的过程。

指纹表面蕴含了大量信息，这些反映出来的表面信息则称为指纹特征。要对指纹进行识别，首先就需要提取出指纹特征。提取出的指纹特征包括了用来识别的2类特征：全局特征与微特征。其中，全局特征是指纹中脊线与谷线形成的全局特定模式，是表面直接呈现的特征，可划分为如下4个特点，即：纹路图案、核心点、三角点、模式点。这4个特点能够在形式上直观描绘出指纹纹路；微特征主要包含纹线终结点、转折点、分叉点。不同指纹也许呈现相同的全局特征，但绝不会呈现相同的微特征，局部微特征的相对位置、类型、方向能够表征指纹的唯一性。

3指纹识别原理

3.1指纹图

指纹是由皮肤表面凸起的纹线构成。指纹由人类遗传基因与环境作用而产生，人人皆有指纹却各不相同。指纹重复率极低，重复率大约为150亿分之一，因而可将其称之为人体身份证。这里，即给出了典型人体指纹视像及采集效果可分别如图1、图2所示。

3.2点模式匹配算法

点模式匹配算法可分为2个步骤，步骤内容可分述如下：

（1）初匹配[8]：通过运算识别图像与未知图像之间的匹配基准点。

（2）二次匹配：优先寻找基准点，对坐标给出校正，再对校正后2幅图的匹配点对数进行计算。

假设有一枚未知指纹A和已知指纹B，指纹A中包含M个特征点，指纹B中包含N个特征点。研究可得，数学形式表述如下：A=xA1，yA1，sA1，θA1，…，xAm，yAm，sAm，θAm

B=xB1，yB1，sB1，θB1，…，xBm，yBm，sBm，θBm（1）将纹线组成的指纹图像A与B，转化得出M维和N维的向量组成形式，从而将这2个向量展开逐项比对，得到一个M×N的匹配矩阵ScoreM×N。这一过程的数学形式可表示如下：

sAi≠sBj则Scoreij=0（2）

sAi=sBj则Scoreij=n 1≤n≤5（3）

S=100×GAB×GAB∕M×N（4）

综合上述的初次匹配设计后，就可以初步判定出匹配指纹。通过初次匹配可以得到最佳参考点，利用最佳参考点则可降低匹配分数，删除差异明显指纹，提高匹配效率。至此，可得数学公式如下：rt

φt=xt-xc2+yt-yc2

arctanyt-ycxt-xc-θc

θt-θc（5）坐标转换后，可以在极坐标系统中得到2个新的极坐标点集A'=（A'1，A'2，…，A'M）与B'=（B '1，B '2，…，B'N），再利用限界盒将A'与B'实现一一匹配。

3.3限界盒算法[9]

限界盒算法用来解决非线性形变。限界盒算法是通过将特征点上的某一固定范围限定为一个盒子，落在限定方位内的比对点可以判定为匹配。得到中心点5个相邻特征点的匹配数，即称作匹配分数，进而由极角与极径组成限界盒子。限界盒的定义可如图3所示。

4深度学习

研究可知，深度学习是由人工智能、信号处理、模式识别优化、以及神经网络等多元化学科交叉后创建的新兴研究领域，深度学习也可以视作机器学习的一种领域拓展。深度网络是一种包含多个隐含层的网络结构，通过这些隐含层可以深入学习更加复杂的函数，还可以实现海量数据的挖掘分析。各层之间会将输入数据进行非线性的变换输出，利用变换输出这一特点，即可在深度网络的海量数据中挖掘到包含重要基本特性的部分数据。深度学习属于多层学习算法，通过深度学习的表征学习方式可以将复杂的数据处理得到简化表示，一个样本可以选用强度值矩阵、灰度值矩阵、方向矩阵等多种方式来刻画像素，通过表征学习，可以找出一种更优方式来对输入数据进行模拟表达。

深度学习是借鉴仿生学原理而推衍架构的一种脑神经网络系统。利用在多层深度网络中的特征抽取，将海量数据进行简洁而具有针对性的输出。数据经过多层结构特征抽取，可以完成监督与非监督下的数据转换，最终可以取得分类识别的预期设计效果。

4.1深度信念网络

深度信念网络[10]（Deep Belief Networks，DBN）是由Hinton等人提出的一种深度学习模型。迄至目前，DBN的应用相对来说较为广泛。通过在输出与标签之间建立了联合概率分布，从而生成结构。利用深度信念网络综合研发的深度学习模型已有很多，如卷积深度信念网络。多个RBM[11]构成了DBN，DBN在灵活性上占据优势，其扩张能力也更强。而且，DBN通过对无标签样本进行非监督学习，有效克服了在传统神经网络中存在的局部收敛，以及训练困难等问题，使部分无标签数据得到了充分、合理的利用，提高了速率。

深度信念网络（DBN）包含了多个隐藏层。其中，RBM由相邻的2层内联组合产生，下层的可见层由上一层的隐藏层提供支持设计，通过上一层的隐藏单元学习到高度相关的阶段性结果[12]。相邻不同层的节点之间存在关联，相同层节点并无关聯，最底层深度信念网络（DBN）的可见层用来组成DBN的输入层。分类识别需要将最高层的RBM隐藏层与RBM逻辑回归层相连，而后再进行分类识别。深度信念网络（DBN）在大数据训练上的效果要更加突出，且数据越多，正确率也越高。

4.2卷积神经网络

卷积神经网络（CNN），是一种由多层结构聚合形成的常用深度学习网络。仅就设计结构而言，相对来说较为特殊，这是一种通过训练而得到的深层网络。训练过程优选了与BP神经网络相同的训练模式，采用前向传播来运算求出数值，再通过最小化误差反向传播调整参数[13]。卷积神经网络（CNN）共有4层，分别是：输入层、卷积层、下采样层和输出层，每一层都配置了一定的主题功能。卷积神经网络的设计结构可如图4所示。

由图4可知，输入层主要就是将输入图像在模型中进行统一处理，输出层的图像处理可以保证卷积层的运行过程。卷积层[14]则是将输入图像与若干权值各不相同的卷积核进行卷积操作，从而获取不同的特征。一类特征可以组成一幅特征图（Feature Map）[15]，卷积核个数与特征图个数相同。下采样层通常称为池化层，池化层的操作分为平均池化层、最大池化层2种。2种操作过程并不相同，但是结果却是相同的。上述两者的设计重点都是对特征图进行降维处理，从而达到降低参数个数的目的。输出层是一种专供连接的分类器。最终将为研究输出最终的识别结果。

卷积网络是由底层复杂输入过渡到高层简单输出的非线性映射过程。过程中，通过结合已知标签类，对数据开展学习与监督性训练，旨在获得对位置标签类的计算表达式。这是一种有监督性的训练模式，目的是使模型具备自我学习能力，进而利用模型在未知标签样本中自主识别并提取样本。该网络的训练阶段也可以看作是一种对样本的学习过程，通过研究剖析已知类样本，对分析样本判定识别分类并进行储存。标签表示采取向量形式，可分为一维或多维，通过设定或运行系统中采集。

4.2.1神经元和稀疏连接

神经元是CNN设计中的基础运算单元。神经元之间采用的连接方式为非全连接，通过非全连接可以降低模型复杂度。利用这种非全连接方式，引入感受域来获取图像局部特征。采用传播算法，便可以得到非线性卷积核以及更大覆盖的感受域。

4.2.2权值共享

权值共享是在卷积操作时，通过规定卷积层中每一个卷积核步长，使其重复作用于输入图像的神经元感受域，与其贡献相同连接权重。采用这种共享方式，可以减少权重数量，加速CNN模型训练。

4.2.3卷积

卷积运算是一种对图片进行学习分析从而提取图片特征的运算过程。通过卷积运算，卷积核与特征实现一一对应。在满足一定量的卷积核的大前提下，可以通过计算成功获取图片的全部特征。在理论上，卷积层是由滤波过程得到的特征图组成，图片的特征信息是通过滤波器对图片滤波的加工提取结果。滤波器每次移动一个步长，卷积核在经此过程后得到的特征图也会随着滤波器的移动而发生改变。

4.2.4池化

池化分为最大池化与平均池化2种方式。2种操作的过程机理并不相同，但是结果却是相同的，都是为了降维并保持旋转、伸缩、平移等不变性。下一层池化层是对上一层池化层得到的特征图做降维处理，在不重叠的邻域之间取平均值，也可将获取的最大值取代此位置原本的像素值。特征图的个数并不会受到池化层运算的干扰，却会使特征图大小发生改变。维数的降低可以使过拟合现象产生的几率下降。

4.2.5激活函数

卷积操作与降采样均要通过线性方式来进行图像特征处理。待分类样本并非皆为线性可分的，对于这种样本需要选用激活函数，同时加入非线性因素，使其建立合适的非线性分类模型。CNN能够提取强大、有效的特征表达，核心关键即在于：激活函数保留了神经元节点的有效信息，又去除了冗余。

4.2.6全连接

全连接层发挥的是分类器的作用。在卷积神经网络中通过对分布特征表示的映射，来标记处理样本空间。全连接层由卷积操作来设计实现，可将符合标准的全连接层转换为卷积或是卷积核。

5实验结果

5.1实验一

研究中，通过点模式匹配算法在NIST DB4F指纹库中选取416幅指纹图像进行试验。其中，拱型112幅，左环88幅，右环120幅，旋涡型96幅，分类结果可见表1。

5.2实验二

本文提出的基于深度学习的指纹识别方法研究，通过神经网络出色的容错性和自我学习能力，使识别具有强大的兼容性和优越性。

在NIST DB4F指纹库中，取拱型56幅，左环116幅，右环124幅，旋涡型108幅。基于CNN一半进行训练，一半进行测试。实验结果可见表2。过程中的平均误识别率4%。

6结束语

指纹识别是一种生物特征识别技术，并因其优秀的可靠性和实用性而获得了时下学界的高度关注与青睐，研究成果也在不断的发展与进步中。本文研究给出的实验结果表明传统的指纹识别方法错误率为6.5%。通过传统的指纹识别方法与深度学习相结合，采用CNN模型用于指纹自动识别则获得较好的效果，错误识别率也提升为4%左右，明显改善了识别效果。经过比较不难发现，传统的点模式匹配算法的识别率并未达到CNN算法的运行效果。但是卷积神经网络在训练设置方面却颇具现实难度，需要通过大量的实验数据来提供支持。因此可以预期，CNN算法能够在指纹识别领域得到更为广泛的应用，但却需要在实验方面继续改进加强，从而将指纹识别率提升至更高。

参考文献

[1] HYDE H. Acute alcoholism and the withdrawal state[J]. Medical Trial Technique Quarterly， 1970，17（2）：186-193.

[2] MAIO D， MALTONI D. Direct gray-scale minutiae detection in fingerprints[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence， 1997， 19（1）：27-40.

[3] JIANG Xudong， YAU W Y， SER W. Detecting the fingerprint minutiae by adaptive tracing the gray-level ridge[J]. Pattern Recognition， 2001， 34（5）：999-1013.

[4] PERALTA D， GALAR M， TRIGUERO I， et al. A survey on fingerprint minutiae-based local matching for verification and identification： Taxonomy and experimental evaluation[J]. Information Sciences， 2015， 315：67-87.

[5] ISENOR D K， ZAKY S G. Fingerprint identification using graph matching[J]. Pattern Recognition， 1986， 19（2）：113-122.

[6] HRECHAK A K， MCHUGH J A. Automated fingerprint recognition using structural matching[J]. Pattern Recognition， 1990， 23（8）：893-904.

[7] WATSON C I， WILSON C L. NIST special database 4[EB/OL]. [1992-03-17]. http：//www.informatik.uni-ulm.de/ni/Lehre/SS03/ENIPRAKT/nist_sd4.pdf.

[8] WANG Li， BHALERAO A， WILSON R. Fingerprint matching method and apparatus： US，US8588484[P]. 2013-11-19.

[9] HOOKER R E， GREER J M. Bounding box prefetcher： EP， US 8880807 B2[P]. 2014-11-04.

[10]LEE H，GROSSE R，RANGANATH R，et al. Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations[C]// Intematioonal Conference on Machine learning. Montreal，Quebec，Canada：ACM，2009：609-616.

[11]KUREMOTO T， KIMURA S，KOBAYASHI K，et al.Time series forecasting using a deep belief network with restricted Boltmann machines[J]. Neurocomputing，2014，137（15）：47-56.

[12]楊阳，张文生. 基于深度学习的图像自动标注算法[J]. 数据釆集与处理，2015，30（1）：88-89.

[13]李飞腾. 卷积神经网络及其应用[D]. 大连：大连理工大学，2014.

[14]NAKASHIKA T， GARCIA C， TAKIGUCHI T. Local-feature-map integration using convolutional neural networks for music genre classification[C]//13th Annual Conference of International Speech Communication Association（INTERSPEECH 2012）. Portland， OR， USA： ISCA，2012：1-4.

[15]LAVIN A. maxDNN： An efficient convolution kernel for deep learning with Maxwell GPUs[J]. arXiv preprint arXiv：1501.06633， 2015.