欢迎访问一起赢论文辅导网
本站动态
联系我们

手机:15327302358
邮箱:peter.lyz@163.com

Q Q:
910330594  
微信paperwinner
工作时间:9:00-24:00

SCI期刊论文
当前位置:首页 > SCI期刊论文
引入感知模型的改进孪生卷积神经网络实现人脸识别算法研究
来源:一起赢论文网     日期:2020-12-08     浏览数:93     【 字体:

  期年 月电 报收稿日期: ; 修回日期: ; 责任编辑: 李勇锋基金项目: 国家自然科 学 基 金( ) ; 陕 西 省 自 然 科 学 基 础 研 究 计 划( ) ; 陕西省重点研发计划() ; 长安大学中央高校基本科研业务费( ) ; 西安市智慧高速公路信息融合与控制重点实验室( )引入感知模型的改进孪生卷积神经网络实现人脸识别算法研究徐先峰,张 丽,郎 彬,夏 振( 长安大学电子与控制工程学院,陕西西安 )摘 要: 针对非限定性条件下人脸识别困难问题,设计了一种引入感知模型的改进孪生卷积神经网络结构() ,在充分利用孪生结构有效减少外界干扰并避免过拟合等优点的基础上,为其增加感知模型实现更丰富特征的提取 为寻找最优学习率引入了循环学习率策略,加速模型收敛在 和 标准人脸数据库上的仿真实验表明,所提 算法提升了人脸识别精度关键词: 人脸识别; 孪生卷积神经网络; 感知模型; 循环学习率中图分类号: 文献标识码: 文章编号: ( )电子学报 : : :, , ,( , , , , ): ( ) ,, ,: ; ; ;引言安防意识的提升促使人们对公共及个人安全需求不断攀升,如何准确快速的鉴定个人身份,保护信息安全,成为亟待解决的关键性社会问题因此,多种生物特征识别技术 应 运 而 生[,],人 脸 识 别 技 术 由 于 其 方 便快捷非侵入性等优点而备受关注,研究成果丰富[]总结经典的 人 脸 识 别 算 法 可 以 发 现,主 成 分 分 析法( )[]通过矩阵变换有效地减少了计算复杂度,但当存在遮挡 等 外 界 因 素 干 扰 时,无 法 获 取 数 据 真 实 子空间结构,识别效果变差支持向量机( )[]方法具有较强的泛化能力,且能很好地处理高维度数据,但其无法适用于 具 有 大 规 模 训 练 样 本 的 应 用 场 合随 着 深度学习技术的快速发展[],基于卷积神经网络的人 脸识别算法[ ]被 广 泛 提 出 其 中, 等 人[]提 出 的将深度学 习 与 传 统 的 特 征 提 取 方 法 建 立 了 联系,对光照 变 化 和 遮 挡 等 表 现 出 了 很 强 的 鲁 棒 性[][]引入了 人脸模型 对 有 姿 态 的 人 脸 分 片仿射 对 齐,提 高 了 识 别 精 度 的[]直 接学习从图像到欧式空间的编码方法 但 和无论在训练还是使用时都需要相当巨大的计算量和数据集,在小规模数据集上并不适用在实际应用中,识别对象往往客观存在着光照 表情姿态和遮挡等复杂干扰,导致人脸识别较为困难,为电 子 学 报 年了更好地对 外 界 干 扰 鲁 棒,提 高 数 据 集 的 处 理 速 度 并解决由于数据集较少而导致的过拟合等问题[],本文在深度学习理论基础上,提出了一种引入感知模型[]的改进孪生卷积神经网络结构() ,并对整 个 训 练 过 程 辅 以 循 环 学 习 率 策 略 优 化 算法[],降低外界噪声干扰提高网络学习能力,同时使得寻找最优学习率变得容易提升网络性能,有效的实现了非 限 定 性 条 件 下 的 人 脸 识 别 利 用[]和[]标准人脸数据库对所提算法进行测试,结果表明所提 网络结构与经典的基于 和基于传统的卷积神经网络的人脸识别算法相比,在识别精度上有大幅提升网络结构模型及学习率策略本文所提 由一对结构相同权值共享的组成的孪生卷积神经网络[]构成,与传统结构不同的是,为孪生卷积神经网络引入了 模型以提取更加丰富的特征,同时网络引入循环学习率[]优化策略来加快训练速度网络结构模型整体的网络构架如图 所示使用度量学习以衡量输入图像之间的相似性 首先,定义一对输入样本( ) ,当 和 属于同一个人时,标签 ,当 和 不属于同一人时,标签将 和 输入孪生网络结构,寻找参数 ,,并利用可微的映射函数 ( ) 将输入映射到目标空间,在目标空间使用距离参数定义相似性,如式( ) 所示( ) ( ) ( ) ( )给定正样本对( ) 和负样本对( ) ,期 望正样本对的相似性度量 较小,负样本对的相似性度量 较大,因此模型需要满足条件: 任意正数 ,( ) ( ) ( )为设定阈值为了能够对孪生神经网络进行训练,定义可微分的代价函数如式( ) 所示:( ( ,,) ) ( ) ( ( ) )( ( ) ) ( )其中,和 分别为只计算相同类别对图片和只计算不同类别对图片的损失函数,( ,,) 表示第个样本进一步定义损失函数如式( ) 所示:( ( ,,) )( ( ) ( ) )( )为训练的样本数当 ,损失为:( ( ,,) ) ( ) ( )即原本不相似的样本,如果距离度量小于阈值,损失减小,则 增大,扩大图像距离当 ,损失为:( ( ,,) ) ( )即原本相似的样本,损失减小,则 减小,图像距离进一步缩小显然,度量学 习 能 够 减 少 复 杂 干 扰 造 成 的 相 同 身份人脸特征 向 量 之 间 的 差 异,并 增 大 不 同 身 份 人 脸 特征向量间的差异,从大量的训练人脸特征向量中,学习该特征空间的更鲁棒更具可区分的距离度量,将原本在原始空间 中 分 辨 困 难 的 数 据 进 行 维 度 规 约,降 低 干扰影响,提升识别精度循环学习率策略循环学 习 率[]( ) 是 一种有效的学习率调整策略,其具体优化过程分为两步:学习率循环范围的确定和在 此范围内学习率的具体调整在正式训练模型之前需要对样本进行一次预先训练以确定学习率的循环变化范围[]根据经验给定一个非常小的 学 习 率 初 始 值,在 训 练 过 程 的 每 个 批 次 中使学习率在初基础上以非始学习率的常低的速率线性增大,绘制损失值关于学习率的变化曲线,损失值下降最快的区域所对应的学习率范围为最优学习率的循环变化范围,其范围的上下界分别称为最大边界( )和最小边界( )[]在已确定的学习率范围内进行相应调整策略优化如图 所示,使学习率在已确定的边界内随迭代次数( ) 的增加周期性变化,选择 个步长( ) 为一个循环周期学习率( ) 从最小边界开始,在设定 的 第 一 个 迭 代 步 长 中 由 初 始 值 逐 渐 上 升至最大边界,在 下 一 个 迭 代 步 长 中 学 习 率 由 最 大 边 界第 期 徐先峰: 引入感知模型的改进孪生卷积神经网络实现人脸识别算法研究下降至最小边界,依次循环往复,完成训练训练时,每经过一个批( ) 学习率更新一次,其更新的具体值由式( ) 计算( ) ( ( ) ) ( )其中,函数表示在两个变量中取较大值, () ( ) , 为取绝对值函数,为对浮点型数据向下取整函数,为步长,表示半个循环周期,一般设定为( ) ,其中 的大小等于使用训练集中的全部样本除以批尺寸( ) , 为变量,在[,]范 围 内 变 化,表 示 此 次 训 练 为 第 个,在训练迭代过程中通过 值的计算对学习率更新从而提高识别准确率,加速模型收敛 算法学习率具体参数选择将在后文给出仿真分析实验数据集数据集: 由于本 文 方 法 针 对 小 规 模数据集,同时为验证其对混合干扰有效,选择两组数据集以对比结果: ( ) 随机选取 个 不 同 人 物,每 人 不超过 张图像,每张图像只含有轻微光照干扰,不含实物遮挡及姿势遮挡等其他干扰 ( ) 同样随机选取个不同人物,每人不超过 张图像,其中随机包含实物遮挡及姿态 变 化 等 干 扰 但 不 包 括 极 端 遮 挡为 方 便 表示,分别记数据集( ) 为数据集 ,数据集( ) 为数据集实验过程与结果分析本文根据不同的结构进行对比试验确定网络卷积层的层数为 层时,网络结构识别率最高; 当卷积层数不变, 个数为 时网络结构识别率最高,损失收敛最低,因此确定网络整体结构为 层卷积层 层池化层 层 层以及 层全连接层为方便后文讨论,分别将不添加添加 模型的网络结构记为 和确定学习率 范 围按 照 经 验 设 置 学 习 率 初 始 值 为,在训练过程的每个批次中使学习率以 的增长速率线性增大,分别记录 数据集下结构和 结构的学习率与损失值并绘制其关系图,如图 所示分析图 可知,当学习率线性增大时损失值会随之减少,一旦学习率增大到一定程度损失值反而会上升,因此学习率周期性变化的范围选择为相应损失值快速下降 的 区 间[],对 于 数 据 集, 结 构 和结构均选择学习率下界 为 ,学习率上界 为 除此之外,还需要设置参数步长,文献[]认为步长一般为( ) ,文献[]通过实验表明, 设成 倍或者 倍的,两者结果并没有太大的不同 因此在本文中选取 和 的中间数,设置为 倍的数据集下的损失收敛如图 所示对于 数据集,在大约前 次的迭代中,固定学习率与循环学习率策略对损失收敛情况表现大致相同,而在 次迭代之后,循环学习率策略相较于固定学习率在迭代次数相同的情况下具有更低的损失值( 见局部放大图) ,且训练样本的损失降到相同值时,结构只需要训练 次左右,而 结构需要训练次,即循环学习率策略使模型收敛到更低的值,且加快了模型的收敛速度同时,比较相同迭代次数电 子 学 报 年次下不同学习率的识别准确率,如表所示表 数据集 下相同迭代次数下识别精度比较( ) ( )表 表明,当迭代次数相同时,循环学习率策略明显有更高的识别准确率,即当达到同一准确率时,循环学习率策略 显 然 需 要 更 少 的 迭 代 次 数本 文 验 证 了 寻找最优学习 率 方 法 的 有 效 性,经 过 较 少 的 全 局 循 环 就可以为模型 寻 找 到 最 优 的 学 习 率,不 再 需 要 人 工 进 行多次尝试,且对比固定学习率,循环学习率使网络具有更好的收敛性在 人脸数据集下经过 次迭代后,最终的识别结果如表 所示由表 可知,在 其余结构不变,仅添加结构的情况下,在 标准人脸数据库上识别率均有明显的提升,其中, 结构使用循环学习率策略识别准确率达到了 ,表现出优异的识别效果表 数据集 下不同学习率识别结果与经典算法比较结果分析为了进一步表明 算 法 的 泛 化 性 能,将 上述基于 数 据 集 确 定 的 相 同 网 络 结 构 参数直接应用 于 标 准 人 脸 数 据 库,并 与其他经典[]和[]算法进行比较最终实验结果如表 所示表 不同算法识别准确率比较分析表 可知, 算法并不是通过训练来提取特征,因此本文算法相较于 算法在识别正确率上有较大提升; 的核函数及其参数需人为选取,引起算法低效; 算法数据集规模较小,识别率较低;算法,能够克服 不能学习到人脸图像局部结构特征的缺点[],但当图像缺乏纹理特征时,其识别性能减弱; 具有 高 精 度 的 识 别 准 确 率,但 其并不擅长处理缺乏纹理变化的强光遮挡算法在三大数据集所达到的高精度识别率,充分验证了其所具有的强泛化能力结束语本文提出了将感知模型和孪生神经网络相结合的架构,并引入循环学习率策略,使得网络收敛速度加快,降低了相同识别率所需要的迭代次数 同时,所提网络结构简单,适 用 于 非 限 定 性 条 件 下 的 小 规 模 数 据 集 的人脸识别,在 和 标准人脸数据库进行了训练与测试,能够达到较高的准确率,是一种性能优异的人脸识别算法第 期 徐先峰: 引入感知模型的改进孪生卷积神经网络实现人脸识别算法研究参考文献[] ,: [] ( ) ,,( ) :[] , , ,: [], ,:[] , , , :[], ,( ) :[] ,[], ,( ) :[] , , ,[], ,:[] , , [] ,,( ) :[] , , ,[], ,( ) :[] , , ,[]( ) [ ] ,[] , , ,[][],[]李倩玉,蒋建国,齐美彬基于改进深层网络的人脸识别算法[]电子学报, ,( ) :, ,[], ,( ) : ( )[] , :? [], ,( ) :[]李小薪,梁荣华有遮挡人脸识别综述: 从子空间回归到深度学习[]计算机学报, ( ) ::[] , ( ) :( )[] , , , :[][] ,[] , , :[][] ,[]吴长虹,苏剑波,陈叶飞抗年龄干扰的人脸识别[]电子学报, ,( ) :, ,[] , ,( ) : ( )[] , ,[][] ,[][] , :[] , , ,[] : ,[] , ,[],,( ) :[] , , ,[][] ,[]梁淑芬,刘银华,李立琛基于 和深度学习的非限制条件下人脸识别算法[]通 信 学 报, ,( ) :, ,[] , ,( ) :( )作者简介徐先峰 男, 年月出生,山东宁阳人博士,副教授,硕士生导师, 会员 年和年分别在哈尔滨工程大学和西安电子科技大学获工学学士和工学博士学位, 年 为 美国加州大学洛杉矶分校( ) 访问学者主要研究方向: 信号处理深度学习算法及应用机械系统状态监测与故障诊断 智能交通信息挖掘智能电网等:张 丽 女, 年 月出生于陕西长安大学电子与控制工程学院在读研究生,研究方向为人脸识别图像处理

[返回]
上一篇:为什么不反对“唯项目”?
下一篇:一种基于协同上下文关系学习的同城活动推荐算法