快手、北邮提出基于特征组合的域比如说性活体检测算法,多项SOTA
发布时间:2025-02-20
在本文的新方法中则会,为了混搭实际上内容构造f_c和音乐风格构造f_s,本文运用 AdaIN 层和时域层创设了构造整合层 SAL,式子描述如下:
其中则会,
分别是3×3时域核,
指出时域操作方法,z则是中则会间表达式。
如果输入的 batch 总长度为N,x_i指出输入的示例,其中则会
。他们的实际上内容构造可以指出为
,音乐风格构造可以指出为
。因此他们相同整合后的构造内部空间
,可以指出为如下:
这个式子代表了对从
中则会所含的实际上内容构造和音乐风格构造的整合处理过程过程。因此,
可以被称之为自混搭构造。
实质功能性地,为了洞察体外实际上的音乐风格构造,本文还合成了一个辅助构造内部空间,通过随机避开原先的以此类推的关系
和
,式子如下:
其中则会random指出随机依此类推,因此
可以被称之为避开混搭构造。
c) 整合构造内部空间中则会的对比修习
从音乐风格转化的视角出发,在跨外延场面中则会的一个主要的障碍在于,外延实际上的音乐风格构造可能则会背后体外实际上的音乐风格构造,这可能则会在被告过渡阶段造成错误。为了解决这个问题,本文提出异议了对比修习的方式而来增强体外实际上的音乐风格构造,同时诱导外延实际上的音乐风格构造。
如所示三示意所示,自混搭构造
在构造内部空间中则会作为锚定等价。受到新方法 [4] 的借鉴,一个停止梯度传导的操作方法被试行于
上,以固定他们在构造内部空间中则会的后方。然后,避开混搭构造
则会根据他们与锚定等价相同的体外标识的的关系,以使得在构造内部空间中则会一侧或者游走相同的锚定等价。在这一处理过程过程中则会,反向传递则会通过避开混搭构造,但不通过自混搭构造,因此体外实际上的音乐风格讯息被实质功能性进一步提高。这里的对比人员伤亡
可以式子化指出如下:
其中则会,
衡量了
外标识的的关系,该处理过程过程可以式子化如下:
所示三:整合构造内部空间的对比修习
三:体外检查大规模检验协约
目前医学界和产业界发挥作用着一些差别,主要可以说明了成如下两个方面。
资料量。与单纯场面相比较,医学界的资料量几乎太小,这可能则会导致数学模型的过拟合,从而允许了借鉴式的发展。为了解决问题这个问题,本文新设了十二个官方网站资料集,然后在此基础上设计了相应的一并和库间检验协约,以实质功能性分析本文的借鉴式安全功能性。
资料原产和该软件指标。在单纯场面下的资料原产,单纯几何图形一般来说则会占优势更大的数目,然而,大多数既有的分析协约都则会收集总数相对于相等的体外与偷袭影像来计算少于信噪比,来透过作为借鉴式分析的结果,这或许与实际上的资料原产发挥作用着差别。除此之外,真实场面中则会的资料一般来说由各有不同原产的多个资料外延分成,然而,在学术界场面中则会,一般来说只举例来说了少量的资料外延。为了减小上述的不一致功能性,在本文提出异议的协约中则会,多个资料结合部;也作为操练集,多个资料结合部;也作为检验集。实际上而言,在操练过渡阶段,所有的操练资料被来透过简化本文的数学模型。在检验过渡阶段,由于各有不同外延中则会单纯几何图形影像原产的类似于功能性 [2],本文收集了所有资料集中则会于的单纯影像作为同列样品,将当前透过测量的资料集中则会于的偷袭影像作为亦然样品,然后计算他们在特定 FPR 下的 TPR。终于计算在各个资料集上检验结果的均值和自表达式作为终于的评价指标。
本文的大规模检验协约常用了十二个官方网站资料集,他们相同的编号如表一中则会示意所示,相同的检验协约设置如下:
协约一:这个协约是一并检验协约。实际上而言,所有的资料集都作为操练集和检验集。
协约二:这个协约是跨外延检验协约,首先本文将十二个资料集划分成两类,录为 P1 和 P2。实际上而言,P1: {D3, D4, D5, D10, D11, D12}, P2: {D1, D2, D6, D7, D8, D9}。因此,该协约也举例来说着两个子协约,分别是协约 2_1 和协约 2_2。实际上而言,协约 2_1 是中用 P1 操练,用 P2 检验。协约 2_2 是中用 P2 操练,用 P1 检验。例外的是,跨外延检验协约或许更很强挑战功能性,由于检验集中则会于举例来说了有可能偷袭和有可能资料外延,这与单纯世界中则会的检验场面更为吻合。
表一:体外检查大协约涉及的资料集及其相同编号
四:物理结果
为了发挥作用全盘的该软件,本文常用 Lee-One-Out(LOO)的方式而在 OULU-NPU、CASIA-MFSD、Replay-Attack 和 MSU-MFSD 资料集上试行跨外延检验。实际上而言,在这四个资料集中则会于随机选择三个资料集可用操练,并在终于剩下的资料集上透过检验。本文同时将所提出异议新方法的检验结果与目前最佳的 SOTA 新方法结果透过对比,如表二示意所示。观察表中则会资料可以看得出来,本文的 SSAN-M 数学模型在 OWildCWildI to M, OWildMWildI to C 和 OWildCWildM to I 协约上赢取了最佳安全功能性,同时在 IWildCWildM to O 协约上赢取了极强竞争力的显出。这些结果归功于本文新方法的外延普遍化安全功能性力。此外,当本文像 SSAN-R 新方法那样,常用 ResNet18 作为构造所含器,录为 SSAN-R 数学模型。可以看得出来 SSAN-R 数学模型的安全功能性得到了实质功能性地提升,并在各个协约上均大约了 SSAN-R 数学模型。上述的物理结果归功于本文的新方法在跨外延场面下的有效功能性。
表二:在协约 OCIM 上与其他 SOTA 新方法的对比
为了实质功能性地分析本文的新方法在真实场面下的安全功能性显出,本文在提出异议的大规模体外检查协约上试行所提出异议的新方法,定量各个协约上的物理结果,如表三示意所示。此外,为了更高地与其他新方法透过对比,本文还定量了各有不同的网络平台形态(如:CNN [5] 和 Transformer [6])和例外的 SOTA 新方法(如:CDCN [7] 和 SSDG [2])在该协约上的显出。从表中则会的检验结果可以看得出来,本文的新方法显露出了最佳的安全功能性,大约了其他的对比新方法,这归功于本文的 SSAN 新方法在真实场面下的有效功能性。例外的是,虽然有些新方法在基本上的检验协约(如 OCIM)上赢取了很差的安全功能性,但是在这个大规模协约上显出却远超过考虑到。这种现象实质功能性揭示了,在思索的体外检查问题中则会,产业界与医学界发挥作用着的差别与分歧。
表三:在体外检查大协约上与其他新方法的对比
为了检验本文提出异议的 SSAN 网络平台的安全功能性和各个子基本功能的有效功能性,本文运可用控制表达式的新方法创设了多个暂时性数学模型。所有的结果均在相同的条件下透过定量,结果如表四示意所示。物理结果得出结论了本文所提出异议的各个基本功能的有效功能性。
表四:在协约 OCIM 上的消融物理
构造图形。为了资料分析本文的 SSAN 新方法懂得的构造内部空间,本文常用 t-SNE 借鉴式 [8] 图形了各有不同的构造原产,如所示四示意所示。对于实际上内容构造,可以看得出来他们的原产更加的集中则会于且紧密,虽然他们可能属于各有不同的资料集或者来自各有不同的需注意。对于音乐风格构造,本文可以看到体外与非体外的例子中间发挥作用着粗糙的分界线,尽管本文无法对他们施加如此一来的监督。这种现象表明,本文对整合构造内部空间的对比修习方式而能够发挥作用增强体外实际上的音乐风格构造,同时诱导其他不相干的部分,如外延实际上的音乐风格构造。对于整合后的构造,为了最终体外与非体外中间的归纳,本文混搭了实际上内容和音乐风格讯息。图形的结果显示了,即使遭遇了有可能的资料,本文的新方法几乎可以在最大限度外延上显露出较好的普遍化功能性。
所示四:各有不同构造的原产图形
五:说明了
在这一段话中则会,该科学研究提出异议了一个属于自己网络平台形态 SSAN,来透过发挥作用很强外延普遍化功能性的体外检查借鉴式。与基本上的新方法如此一来在影像或许表征上提升外延普遍化功能性的长处各有不同,该科学研究基于实际上内容构造和音乐风格构造在统计资料特功能性上的差别,对他们试行各有不同的处理过程。实际上而言,对于实际上内容构造,本文运可用了结盟修习的模式,使得网络平台不能对他们透过资料外延某种程度的区分。对于音乐风格构造,本文常用了对比修习的方式而,来增强与体外实际上的音乐风格讯息,同时诱导外延讯息实际上的部分。然后,本文对以此类推的实际上内容和音乐风格构造透过混搭,构成或许构造指出,并来透过终于的归纳。
此外,为了避免出现医学界与产业界中间的差别,本文通过新设既有的官方网站资料集,创设了大规模体外检查检验协约。在既有的协约和本文所提出异议的协约上,所提出异议的 SSAN 借鉴式均赢取了最佳的显出。
请注意:
[1] Yu Z, Qin Y, Li X, et al. Deep learning for face anti-spoofing: A survey[J]. arXiv preprint arXiv:2106.14948, 2021.
[2] Jia Y, Zhang J, Shan S, et al. Single-side domain generalization for face anti-spoofing[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 8484-8493.
[3] Huang X, Belongie S. Arbitrary style transfer in real-time with adaptive instance normalization[C]//Proceedings of the IEEE international conference on computer vision. 2017: 1501-1510.
[4] Chen X, He K. Exploring simple siamese representation learning[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 15750-15758.
[5] Chen X, He K. Exploring simple siamese representation learning[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 15750-15758.
[6] Touvron H, Cord M, Douze M, et al. Training>[7] Yu Z, Zhao C, Wang Z, et al. Searching central difference convolutional networks for face anti-spoofing[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 5295-5305.
[8] Van der Maaten L, Hinton G. Visualizing data using t-SNE[J]. Journal of machine learning research, 2008, 9(11).
[9] Ganin Y, Lempitsky V. Unsupervised domain adaptation by backpropagation[C]//International conference on machine learning. PMLR, 2015: 1180-1189.
较慢手 MMU 详述
较慢手 MMU(Multimedia understanding) 部门同列责较慢手关站海量音预告片、直播的实际上内容表达出来,在多个技术运用领外延广泛总体布局,比如视觉朝著,在预告片、直播、影像的资料分析和表达出来、视觉检索、预告片分解等技术上有成熟运用和投入;预告片朝著,在语音定位 Wild 合成、音乐表达出来与分解、预告片后部与归纳等技术上达到产业高科技水准,同时也有知识所示谱、NLP、终端词曲、实际上内容商业价值表达出来等多种意志力,为发挥作用跨模态实际上内容表达出来奠定基石。
MMU 为较慢手多样功能性包括 500 + 终端一站式,运用在搜索、推荐、多样功能性资料分析、风险控制等诸多场面。制作组具备业内最顶尖的借鉴式设计者和运用设计者,小规模募兵实际上运用领外延技术人力资源,博士占比 15%,硕士及以上占比 95%,具备人工终端运用领外延发明专利 394 件,每年发表论文数十篇。
。肠胃不适恶心想吐怎么办急性角膜炎的症状及治疗方法
济南耳鼻喉检查多少钱
伤口愈合慢
着凉肠胃不舒服怎么缓解
怎么补充眼部营养让视力变好
视疲劳用什么药
眼睛酸胀痛是怎么回事怎么办
维生素
扭伤止痛药
上一篇: 同是虾皮,白色和黄色有啥区别?老渔告诉你,弄懂再买也不迟
下一篇: 鉅浪混动+影酷 来信!
-
央行:完善市场化利率构成和传导机制 优化央行政策利率体系
证券时报网讯,中国人民银行业货币政府评议会2021年月份(总第95次)例会于12月24日在北平召开,开会指出,深化金融供给侧结构性改革,正向大银行业服务重心入水,推动中小银行业聚焦主责行会,支持
- 2025-05-10“不躺平”的阳光城合并多个区域,行业收缩下房企缩肩胛骨自救
- 2025-05-10人体缺乏维生素B2,身体会出现哪些副作用?该如何补充?
- 2025-05-10“非洲手机之王”,难做网络服务业务
- 2025-05-10城市副中心将建潮白河景区
- 2025-05-10合合信息旗下照相全能王发布年度报告,全年用户照相超过10亿次
- 2025-05-10汾州一开发商封堵公共区域问题谁来处理?
- 2025-05-10周三黄金期货收高0.5% 创今年迄今最高个股
- 2025-05-10后天电子音乐Nikko发布新单《Hellfire》 DUBSTEP燃炸来袭
- 2025-05-10中交地产:宜昌渝富减持602万股,累计减持比例为0.87%
- 2025-05-10虚拟形象运营平台「分享时代」开启“公民权利元宇宙”,新一轮融资认购已完成,投前估值30亿元