相似度对比软件人脸在线_人脸相似度识别软件

2024年 9月 15日下午2:08 • 激活谷笔记

相似度对比软件人脸在线_人脸相似度识别软件快速上手 PyTorch 人脸相似度计算方法 ArcFace我在学习今年的一篇和人脸生成相关的论文时，看到了一个约束人脸相似度的 loss。这个 loss 基于经典的 ArcFace 人脸识别网络。ArcFace 是 20

快速上手 PyTorch 人脸相似度计算方法 ArcFace 　　我在学习今年的一篇和人脸生成相关的论文时，看到了一个约束人脸相似度的 loss。这个 loss 基于经典的 ArcFace 人脸识别网络。ArcFace 是 2019年发表的，这么久了还有人用，说明这是一篇适用性很强的工作。于是，我顺手学了一下 ArcFace 的相关背景。在这篇文章中，我将简要分享 ArcFace 人脸识别网络的发展历程，并介绍如何快速利用它的开源 PyTorch 项目计算任意两幅人脸的相似度。　　人脸识别与 ArcFace 　　人脸识别是在深度学习时代取得较大突破的一项任务：给定一个登记了 N 个人的人脸数据库，再输入一幅人脸，输出这个人是否是 N 个人中的某一个。　　多数深度学习算法会用一个 CNN 来提取所有人脸图片的特征，如果输入的图片特征和数据库里的某个特征的向量相似度大于某个阈值，就说明识别成功。也就是说，人脸识别的关键在于如何用 CNN 生成一个「好」的特征。特征的「好」体现在两点上：1) 同一个人的人脸特征要尽可能相似；2) 不同人的人脸之间的特征要尽可能不同。　　为了达成这个目的，研究者提出了不同的学习特征的方法。最直观的方式是像学习词嵌入一样，用一个具体的任务来学习特征提取。恰好，人脸识别可以天然地被当成一个多分类任务：对于一个有 N 个人的人脸训练集，人脸识别就是一个 N 分类任务。只要在特征提取后面加一个线性层和一个 softmax 就可以做多分类了。训练好多分类器后，扔掉线性层和 softmax 层，就得到了一个特征提取器。　　这种基于 softmax 分类器的学习方法确实能够区分训练集中的人脸，但在辨别开放人脸数据集时表现不佳。这是因为 softmax 的学习目标仅仅是区分不同类别的人脸，而没有要求这种区分有多么分明。后续的多篇工作，包括 ArcFace，都是在改进训练目标 softmax，使得每类对象之间有一个较大的间隔。

　　为了让不同的类别之间存在间隔，研究者们详细分析了 softmax 函数。假设
$x \in \mathbb{R}^d$ 是人脸图片提取出的维度为
的特征向量，它属于
类里的第
类。softmax 前的线性层的参数是
$W\in \mathbb{R}^{d\times N}, b\in \mathbb{R}^N$ 。则基于 softmax 的多分类误差可以写成：　　
$L = -log\frac{e^{W^{T}_{y}x+b_y}}{\sum_{j=1}^{N}e^{W^{T}_{j}x+b_j}} \\$ 　　其中，向量内积
可以展开为：
$W^T_jx=||W^T_j|| \ ||x|| \ cos \theta_j$ ，其中
$\theta_j$ 是两个向量的夹角。如果对向量
和
都做归一化的话，再令
，则新的误差可以写成：　　
$L = -log\frac{e^{cos\theta_y}}{\sum_{j=1}^{N}e^{cos\theta_j}} \\$ 　　也就是说，对于这种归一化的多分类误差，对误差产生贡献的只有特征向量和
的列向量的夹角。那么，我们就可以换一个视角来看待这个误差：
其实是
个维度为
的向量的数组，它们表示了
个人脸类别的中心特征向量。误差要求每个特征和它对应的中心向量的夹角更小。　　为了让不同的类别之间有更大的间隔，相同类别内部更加聚拢，ArcFace 在误差的
中加了一个常数项。　　
$L = -log\frac{e^{cos(\theta_y+m)}}{e^{cos(\theta_y+m)}+\sum_{j=1, j \neq y}^{N}e^{cos\theta_j}} \\$ 　　直观上来看，加这一项就是把角度远离类别中心的惩罚扩大，使得各个类别的数据都更加靠近中心。这一优化是有效的。作者做了一个简单的实验，用8类人脸的训练集训练了一个维度为2的特征。其可视化结果如下（线是各个类别中心的方向向量，点是样本的特征向量）：

　　ArcFace 的核心思想就是其 loss 的设计。ArcFace 的网络架构没有特别的要求，一般使用 ResNet 就行。　　使用 ArcFace 开源项目　　其实用这个库的时候可以完全不懂 ArcFace 的原理。　　可能是由于「ArcFace」这个名字和其他项目撞车了，ArcFace 的官方 GitHub 仓库叫做 insightface。其 PyTorch 实现的网址是 https://github.com/deepinsight/insightface/tree/master/recognition/arcface_torch。　　早期该论文没有官方的 PyTorch 实现。有人用 PyTorch 复现了该论文（https://github.com/TreB1eN/InsightFace_Pytorch ）。我使用的项目是这个复现版，它更完整一点，包含了人脸预处理代码。　　人脸识别任务最简单的例子是输出两幅人脸的相似度。接下来我将介绍如何安装这个项目，并用它来编写一个简单的计算人脸相似度的 demo。　　安装这个库很方便，只要一键就行。这个项目基本不依赖什么第三方库，环境里有 PyTorch，NumPy 等常见库就行了。　　仓库后，在 README 的链接里下载 IR-SE50 模型。随便放在哪个目录里。比如下载 IR-SE50 @ Onedrive 。　　最后，还要准备一下测试图片。我很机智地使用了吴恩达《深度学习专项》里讲人脸识别时用到的图片，分别命名为。

　　准备就绪后，就可以编写 demo 了。在做一个人脸相关的项目时，一般会先对人脸做预处理，让所有的人脸图片都有相同的分辨率，且五官的位置对齐。我们的 demo 也是先利用了项目中的人脸预处理库对齐人脸，再调用模型计算相似度。这三张图片的对齐结果如下：

　　这个demo会输出第一张人脸和第二、第三张人脸之间的相似度。完整的 demo 代码如下（注意修改其中的路径）：　　可能是 NumPy 更新的原因，代码在读取时少了，会报错。要在的几个的地方加上。不知道在哪加也没关系，报错了再补上即可。　　修改完毕后，直接运行脚本就行了。其输出大致为：　　第一个输出是模型输入张量的形状。第二个输出是模型输出的特征的性质。了解这两个形状信息有助于我们调用此库。　　第三个输出是第一、第二张人脸的cos相似度，第四个输出是第二、第三张人脸的cos相似度。我们已经事先知道了，第一和第二张人脸图片是同一个人，第一和第三张人脸图片是两个人。所以说，这个输出结果非常正确。　　在我们自己的人脸项目中，一般都会准备好人脸预处理的代码。因此，在调用这个库时，可以只把里的代码复制过去，只使用该项目的模型即可。使用时注意输入输出的形状要求。　　参考资料　　ArcFace 论文：ArcFace: Additive Angular Margin Loss for Deep Face Recognition 　　官方仓库：https://github.com/deepinsight/insightface 　　PyTorch 复现仓库：https://github.com/TreB1eN/InsightFace_Pytorch 　　YaqiLYU：人脸识别的LOSS（上）　　YaqiLYU：人脸识别的LOSS（下）

l298n输出电流是多少_直流12v2a等于多少瓦

上一篇 2024年 9月 15日下午2:06

霍夫曼编码怎么求码字_曼彻斯特编码1是从低到高吗

下一篇 2024年 9月 15日

激活谷笔记

《计算机组成原理》_计算机组成原理期末知识点总结

《计算机组成原理》_计算机组成原理期末知识点总结【计算机基础】计算机组成原理学习笔记 – 第二章|持续更新计数演化罗马数字阿拉伯数字思想基于加法思想基于乘法思想符合符号反映权重符号反映权重进位计数制十进制r进制：任意进制->十进制二进制<=>八进制、十六进制f

2024年 8月 29日
激活谷笔记

WebStorm激活2022.2.5(IDEA激活码2023安装最新教程「永久激活，亲测有效」)

WebStorm激活2022.2.5(IDEA激活码2023安装最新教程「永久激活，亲测有效」)

2024年 6月 26日
Navicat Premium 16.2.7激活(Navicat for MongoDB激活成功教程版)

Navicat Premium 16.2.7激活(Navicat for MongoDB激活成功教程版)

激活谷笔记 2024年 8月 17日
激活谷笔记

PyCharm2024.1.5激活码(2024年Python最全Pycharm 搭建 Django 项目（非常详细）_pycharm django(1)，2024年最新2024年Python大厂面试)

PyCharm2024.1.5激活码(2024年Python最全Pycharm 搭建 Django 项目（非常详细）_pycharm django(1)，2024年最新2024年Python大厂面试)

2024年 8月 15日
RubyMine2024.1.4激活码(RubyMine 2024.1 版本永久激活激活成功教程教程，附最新RubyMine注册码（亲测好用）)

RubyMine2024.1.4激活码(RubyMine 2024.1 版本永久激活激活成功教程教程，附最新RubyMine注册码（亲测好用）)

激活谷笔记 2024年 7月 2日
关系模式分解要遵循什么原则呢_目标分解的基本原则

关系模式分解要遵循什么原则呢_目标分解的基本原则教育知识与能⼒模块⼀教育基础知识与基本原理第⼀章教育的产⽣与发展“教育” 这⼀词最早出现于《孟⼦·尽⼼上》（单选·了解）“君⼦有三乐，⽽王天下不与存焉。⽗⺟俱存，兄弟⽆故，⼀乐也；仰不愧于天，俯不怍于⼈，⼆乐也；得天下英才⽽教育之，三乐也。 ”——《孟⼦·尽⼼上

激活谷笔记 2024年 9月 17日
device offline是什么意思_device error怎么解决

device offline是什么意思_device error怎么解决offline是什么意思_offline用英语怎么说_offline的翻译_offline翻译成_offline的中文意思_offline怎么读,offline的读音,offline的用法,offline的例句全部四级六级

激活谷笔记 2024年 9月 4日
激活谷笔记

PyCharm2024.1.1激活码(PyCharm 2024.1最新版免费激活激活成功教程安装教程（附激活工具+激活码）-永久持续更新)

PyCharm2024.1.1激活码(PyCharm 2024.1最新版免费激活激活成功教程安装教程（附激活工具+激活码）-永久持续更新)

2024年 7月 6日
Idea2024.1.5激活码(IDEA激活码,IDEA稳定激活码(2023长期更新))

Idea2024.1.5激活码(IDEA激活码,IDEA稳定激活码(2023长期更新))

激活谷笔记 2024年 8月 12日
Datagrip激活2024.1.3(解决 DataGrip 2024.1.3 连接 Tdengine 时timestamp字段显示时区不正确问题)

Datagrip激活2024.1.3(解决 DataGrip 2024.1.3 连接 Tdengine 时timestamp字段显示时区不正确问题)

激活谷笔记 2024年 6月 7日
激活谷笔记

PyCharm激活2023.2.4(IntelliJ IDEA 2023.2.0 IDEA2023中文激活版)

PyCharm激活2023.2.4(IntelliJ IDEA 2023.2.0 IDEA2023中文激活版)

2024年 7月 24日
激活谷笔记

二叉树可能成为折半查找判定树_下列二叉树可能成为折半查找判定树

二叉树可能成为折半查找判定树_下列二叉树可能成为折半查找判定树下列二叉树中，可能成为折半查找判定树（不含外部结点）的是（）折半查找判定树实际上是一棵二叉搜索树，它的中序遍历序列是一个单调序列。折半查找即二分查找，假设搜索的有序数组为 A[1:n] ，目标元素为 target，二分查找伪代

2024年 5月 23日

相似度对比软件 人脸在线_人脸相似度识别软件

相关推荐

相似度对比软件人脸在线_人脸相似度识别软件