天才一秒记住【热天中文网】地址:https://www.rtzw.net
到底是哪里出了问题?
思索半响,张晓龙也没想出个所以然,只得暂且压下心头烦躁的情绪,强迫自己回归理智。
当务之急,是分析微信此次拋出的几项新功能。
比较重要的有两项。
其一自然是“摇一摇”
。
这项功能,算是“附近的人”
的进阶版,可进一步降低陌生人社交的门槛,激活社交场景,提升用户的新鲜感及活跃度。
其二,“语音消息转文字”
。
功能如其名。
相比於“摇一摇”
,这项功能,还要更加让张晓龙惊艷且头疼。
看似简单,实则技术含量极高,且麻烦得很。
深入解析后可发现,微信是通过某种,多重加密过的分布式语音识別引擎,將语音信號切割为50ms片段,而后利用极光云的强大算力,將其实时转写为文本。
准確率更是高达92%以上!
即便是方言,准確率也在85%以上!
如果让他们开发的话,单是確定技术路线,调整微聊架构,开发语音识別引擎,就需要至少6~8个月。
此外,还需要大量数据进行训练,提升准確率,至少又要耗去4~6个月。
这还是在能申请到,集团已经开发至中期的云计算平台的算力资源的情况下。
即便如此,也很难保证,普通话的准確率,能达到85%以上。
当前主流的语音识別技术,仍为gmm-hmm框架,准確率普遍在80%左右。
而极光採用的,应该是“悠米智能助手”
自研框架的变种。
全球范围內独一档的水准。
。
语音识別引擎研发完成后,还需要將其集成到,集团的云计算平台之上,以实现即时快速语音识別。
再加上后期的联调与测试,至少又要耗去大半年。
也就是说,在资源充足,且技术难题顺利解决的情况下,他们也至少需要16~20个月左右的时间,才能追上微信现在的水平。
。
即便將標准放到最低,极致依赖开源工具,使用公开数据集,仅支持安静环境短语音,准確率在80%左右,也至少需要半年以上的开发周期。
。
更要命的是,这项功能,看似平平无奇,但却远比“摇一摇”
还要重量级,他们不开发还不行。
。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!