阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 153|回复: 0

[论文] 《基于时间尺度聚合的短语音说话人识别》作者:王逸轩,别红霞【PDF】

[复制链接]

用户组:分区版主

我,秦始皇,打钱

爱心会员勋章重建论坛爱心会员勋章重建论坛勋章版主勋章分区版主勋章

      UID
51
      积分
21093
      回帖
1364
      主题
2163
      发书数
757
      威望
16172
      铜币
85661
      贡献
2400
      阅读权限
100
      注册时间
2025-2-27
      在线时间
3890 小时
      最后登录
2025-12-15
发表于 2025-5-6 04:44 | 显示全部楼层 |阅读模式
基于时间尺度聚合的短语音说话人识别
王逸轩,别红霞
(北京邮电大学人工智能学院,北京市,100876)
摘要:说话人识别技术基于个体语音特征进行身份区分,广泛应用于语音助手、智能安防等领域。然而,短语音数据由于时长有限,难以提取稳定的说话人特征,严重影响识别准确率。
传统的多尺度特征聚合方法大多侧重于通道维度上的信息融合,可能无法充分捕捉短语音场景下关键的时序动态信息。本文提出了一种基于时序特征的多尺度特征聚合方法。该方法通过构建多尺度特征提取模块,有效捕捉短语音中的局部和全局时序特征。该方法可以增强不同尺度特征的互补性,在模型规模减小50%的情况下,并实现约1%的准确率提升。
关键词:人工智能;说话人识别;短语音;特征聚合
中图分类号:TN912.34



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +1 铜币 +2 收起 理由
飞乌与渔 + 1 + 2 论坛有您更精彩!

查看全部评分

[发帖际遇]: 书呆熊 在论坛上传违禁小说,被网警发现,处罚 5 铜币. 幸运榜 / 衰神榜
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-12-16 09:03 , Processed in 0.288505 second(s), 31 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表