AI语音输入全面升级:方言识别准确率提升30%,日均使用近20亿次
随着搜狗输入法20.0 AI大版本的发布,AI语音输入功能迎来了一次质的飞跃。基于腾讯混元研发的AI语音大模型,新版本在多个维度实现了突破性进展。
核心数据提升
本次语音升级带来的提升是全方位的:
- 流畅性提升 40% — 语音识别响应更快,减少等待延迟
- 整体准确率达 98% — 行业领先的识别精度
- 方言识别准确率提升 30% — 覆盖更多方言场景
- 轻声识别增强 — 低于20分贝环境下仍保持高准确率
轻声场景:图书馆里也能语音输入
新版本在"轻声场景"下表现尤为出色。在图书馆、办公室等低于20分贝的环境下,识别准确率仍能保持在行业领先水平。这意味着用户不再需要大声说话,轻声细语也能被准确识别。
AI语音算法负责人饶丰透露,语音输入的用户使用热度持续攀升,近两年日访问量保持高速增长,目前日请求量已接近20亿。用户结构呈现明显年轻化特征。
相较于打字输入,语音输入因更快更便捷正成为更多人的选择。目前搜狗输入法日均语音使用次数已接近20亿次,居输入法行业第一。
口语转书面语:你的"电子嘴替"
新推出的"口语转书面语"功能是本次升级的一大亮点。该功能依托腾讯混元基础模型,可一键将口语化的、散乱的语音输入内容,智能润色为通顺、简洁的书面文本,成为用户的"电子嘴替"。
例如,当用户语音输入"那个就是我觉得这个方案吧还是有点那个就是不太行"时,系统会自动润色为"我认为这个方案还有待改进"。这让语音输入不再只是简单的语音转文字,而是真正成为高效的写作辅助工具。
iOS 端特别优化
在 iOS 端,搜狗输入法20.0.0版本带来了针对性优化:新增浮动语音面板,支持边说边改,智能补全标点,且语音输入无需跳转页面,交互更加便捷。气声、模糊音等细微语音的抓取能力也显著增强。
来源:新浪科技

