微软展示诡异的Silent Voice无声语音通信技术
2023-03-31 11:05:35 时间
微软致力于开发一种新的语音输入接口,允许用户在没有声音出现的情况下进行说话和录音。该研究由微软研究院进行,并在 ACM CHI 2018 中进行了介绍。这种技术被称为 SilentVoice 通过录制呼吸时发出的声音来实现通信,这种允许类似耳语的声音就足够让麦克风录制语音而不会打扰周围的人。此外,该模块还将过滤周围的语音,因此即使有外界干扰,用户也可以捕获清晰的语音。
SilentVoice 是一种新的语音输入接口设备,可以在日常生活中利用基于语音的自然用户界面(NUI)。
所提出的“渐进式语音”方法能够将麦克风放置在非常靠近嘴的前部而不受噪声的影响,捕获具有良好S/N比的非常柔和的语音。它实现了超小(低于 39dB(A))的语音泄漏,允许使用语音输入,而不会在公共和移动情况以及办公室和家庭中烦扰周围的人。(终于不会打扰到人用 TNT 啦!)
通过测量气流方向,SilentVoice 可以轻松地让外部声音与正常话语分离,准确度达 98.8%,在语音通信启动前不需要念激活词。它还可以配合带有经过专门训练的语音识别器的语音激活系统,评估结果产生的单词错误率(WERs)为 1.8%(说话者依赖条件),7.0%(说话者无条件),包含有 85 个命令句,这意味着类似耳语的自然语音也可用于实时语音通信。
您可以在 ACM CHI 计算系统会议上查看完整的演示文稿:https://youtu.be/9EV1mEtVfuM
该技术仍处于研究阶段,但肯定会帮助那些喜欢使用语音命令但喜欢在不打扰周围人的情况下工作的人。
相关文章
- 本周六与京东、微博、华为等实战专家与你共同探讨容器技术实践!
- 谷歌云平台使用英特尔处理器背后 探索硬件厂商那颗“软件”的心
- 大比拼:用24种可视化工具完成同一项任务的心得体会
- 深度 | 探索实物与VR间重量转换的方法
- 重磅长文|提高深度学习性能的四种方式
- 2016搞笑诺贝尔奖公布 男子因假装自己是山羊获奖
- 在Ubuntu上安装和配置Nvidia Optimus驱动
- 周末读物|当你改变世界却没有人注意
- 如何使用Tmux提高终端环境下的效率
- 黑产揭秘:“打码平台”那点事儿
- 推荐5个机器学习API
- 不止围棋 手机里的阿尔法狗帮你p图选发型
- 为什么要了解科学史
- 你不一定知道,如何重置CentOS 7的Root密码
- 电影魔术|改变世界?乔布斯可不仅仅用苹果
- CentOS 7下搭建高可用集群
- 关于Fintech的九个预言
- 「赫曼方格」视错觉怎么破?
- 如果蚊子消失,世界会怎样?
- 哈佛商评|投资者的阅读习惯如何影响股价