- 0
- 0
- 约2.46万字
- 约 6页
- 2026-02-26 发布于北京
- 举报
多通道差分ASR在智能眼镜上对佩戴者语音识别的鲁棒性
杨宇峰,黄一腾,徐勇,万丽,孙寿温,刘洋,范义锋,
杨兆军,奥利维尔·肖安,刘悦,孙明,弗洛里安·梅策
TheOhioStateUniversity,USAMeta,USA
yang.5662@,yah@,yongxu@
ABSTRACT说话人身份的情况下区分佩戴者和旁观者。对于波束成形器,
我们使用了调整后的最小方差无失真响应(MVDR)波束成形
随着智能眼镜
您可能关注的文档
- Ticket-Bench:多语言和区域化代理评估的起点.pdf
- 测量说话人去识别系统中的软生物特征泄漏.pdf
- 联邦自适应表决优化技术: 通过掩码最优传输在联邦学习中的精确分布对齐.pdf
- 利用 物理信息背景定向薛定谔断层成像技术进行室内气流成像.pdf
- 在大型语言模型中模拟偏见缓解场景.pdf
- 因果反事实 RAG:将因果反事实推理整合到 RAG 中.pdf
- 哈希基线:在预训练模型时代重新思考.pdf
- 通过在 3D 高斯图表示中使用解析的碰撞锥屏障函数实现感知集成的安全关键控制.pdf
- GestOS:通过大型语言模型进行高级手势解析以控制任何类型的机器人.pdf
- 大型语言模型系统中提示缺陷的分类法.pdf
- Q-ROAR:量化长上下文大语言模型中 RoPE 位置插值的异常感知重新缩放.pdf
- 用于相同库默方程的神经网络:架构考虑与性能评估.pdf
- 基于扩散的无监督音视频语音分离在有噪声先验的嘈杂环境中.pdf
- 研究使用开源数据的手机图像创建增强虚拟环境(AVE)的方法.pdf
- 关于一类 Hermite 双变量插值问题的扩展.pdf
- 冻结标签问题在二维空间中带有 L1 距离的情况下是 NP 难的.pdf
原创力文档

文档评论(0)