阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 211|回复: 2

[论文] 《基于多尺度注意力融合的说话人识别方法》作者:刘一泽,伍淳华【PDF】

[复制链接]

用户组:分区版主

我,秦始皇,打钱

爱心会员勋章重建论坛爱心会员勋章重建论坛勋章版主勋章分区版主勋章

      UID
51
      积分
21003
      回帖
1359
      主题
2147
      发书数
747
      威望
16103
      铜币
82041
      贡献
2400
      阅读权限
100
      注册时间
2025-2-27
      在线时间
3882 小时
      最后登录
2025-12-13
发表于 2025-3-13 16:43 | 显示全部楼层 |阅读模式
基于多尺度注意力融合的说话人识别方法
刘一泽,伍淳华
(北京邮电大学网络空间学院,北京,100876)
摘要:RcsNet模型是说话人识别领域内的主流模型,其具有优秀的局部信息获取能力,但获取全局信息欠缺。相关领域的研究表明将全局信息引入ResNet模型能够有效提高模型性能。因此,本文向ResNet模型引入多尺度特征提取和多尺度注意力融合模块,提出了基于多尺度注意力融合的说话人识别方法,通过这两个模块可以有效建模全局信息,丰富模型对于说话人身份信息的获取。其次,使用多头注意力池化代替传统统计池化,有效提升话语级特征向量对于不同说话人的区分度。最终通过仿真实验验证了本文所提方法的有效性和优越性
关键词:说话人识别;残差网络;注意力机制
中图分类号:TN912.34





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +1 铜币 +2 收起 理由
飞乌与渔 + 1 + 2 论坛有您更精彩!

查看全部评分

[发帖际遇]: 书呆熊 调戏牧羊犬,被咬,打防疫针,花费 4 铜币. 幸运榜 / 衰神榜
回复

使用道具 举报

用户组:管理员

爱心会员勋章重建论坛爱心会员勋章重建论坛勋章管理员勋章

      UID
5
      积分
158559
      回帖
23304
      主题
17341
      发书数
17328
      威望
118508
      铜币
417729
      贡献
2400
      阅读权限
200
      注册时间
2025-2-27
      在线时间
1686 小时
      最后登录
2025-12-13
发表于 2025-6-4 06:27 | 显示全部楼层
这个是不是可以用于防止电信诈骗
回复

使用道具 举报

用户组:翰林

灌水王者

      UID
1376
      积分
16738
      回帖
30147
      主题
14
      发书数
0
      威望
1657
      铜币
40137
      贡献
0
      阅读权限
80
      注册时间
2025-3-1
      在线时间
1335 小时
      最后登录
2025-12-13
发表于 2025-6-17 02:55 | 显示全部楼层
是不是就是不单止人脸识别了,现在连声音,语言都可以慢慢识别并运用到机器人那里了~~~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-12-13 11:52 , Processed in 0.089340 second(s), 31 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表