图片来源:图虫创意
近日讯飞输入法新版上线,科大讯飞(002230,股吧)正式推出一套离线输入方式,包括完全离线的拼音、语音及手写输入,以更好的保护用户数据安全。
据《信息安全技术移动互联网应用(App)收集个人信息基本规范》规定,输入法类应用程序为用户提供键盘、手写、语音等方式输入字符功能的服务,该服务类型必须遵循知情同意和最小必要原则,明确无需个人信息即可使用基本服务功能。
其他类型的互联网App也需如此。近日,国家对互联网平台违规收集用户个人信息的行为监管日趋激烈严格,已有多家互联网企业下架接受网络安全审查。未来,把个人数据的控制权交给用户,将会成为互联网App的主流趋势。
拼音输入、手写、语音识别均可“离线化”
据悉,在新版讯飞输入法内,手写和拼音输入都可以实现“离线化”,用户打字数据不会被传到互联网上。同时,该版本也会将AI能力“离线化”,既保证智能化体验,又可解决用户数据安全问题。
如离线语音输入方面,新版讯飞输入法升级了AI语音识别模型,在不联网的环境下,无云端数据传输,通过手机本地解码就能为用户提供转文字服务,可以满足在任何场景下进行语音输入的需求。用户也可以通过设置自主选择启用或停用离线语音输入。
后续,讯飞输入法将对OCR识别、智能翻译等更多AI功能进行广泛的“本地化”。
值得一提的是,讯飞输入法新版还推出“基础输入”模式,该模式下不上传任何数据也能顺畅输入,同时用户可以使用皮肤、表情等功能,尽可能保障输入体验。如果想获得更多元的输入体验,享受更智能化的服务,用户可以通过【全部设置】-【隐私设置】-【使用方式】-开启完整体验。对于“完整体验”的设计,讯飞输入法也会进行严格把关,清晰列出系统权限使用说明。
AI能力行业领先
在AI能力方面,讯飞输入法一直走在行业前列。
讯飞输入法AI功能包括智能语音输入、智能OCR识别、智能翻译等多个方面。
智能语音输入即识别用户语音自动输入文字。目前,讯飞输入法语音输入可实现1分钟打400字。
为提高识别准确率,科大讯飞持续深耕语音识别领域,令通用语音识别率在98%基础上再获重大突破。
在扎实技术的支持下,讯飞输入法还支持粤语、四川话、东北话、闽南语等23种方案识别,以及英、日、韩、俄等多国语言输入。
除提高正常语音情况下的识别率外,通过搭载耳语识别等技术,讯飞输入法在轻声说话、噪声等复杂环境中也能保持超高识别率。
此外,讯飞语音输入还可在PC端操作,支持23种方言、3种民族语言以及4种外语,同时支持跨屏操作:手机充当电脑麦克风,使用手机语音输入时,电脑屏幕上能快速打字。
在手写识别方面,讯飞输入法基于空间注意力机制的端到端思想独家打造出OCR识别引擎,支持两万多类中文字符、52类英文字符、10类阿拉伯数字以及100多种特殊符号,行书、草书、生僻字、数字符号等都能识别并转成电子文档。
此外,讯飞输入法还拓展了机器视觉技术,在传统OCR文字识别基础上新增拍照翻译、手写公示识别等功能,甚至能够对数学运算进行智能批改。
在翻译方面,据了解,凭借自研核心的翻译技术以及对大数据的深度挖掘,讯飞输入法的随声译能够支持日语、韩语、西班牙语、泰语越南语、德语、法语、俄语等多国主流语言与中文的即时互译。
技术的发展也是为服务更多的人群,在这些AI技术的支持下,讯飞输入法成为了国内最早适配无障碍功能的App之一,依托无障碍语音输入、表情输入等功能,为视障人群铺设了通向互联网世界的“盲道”。
以讯飞输入法在无障碍模式上做了诸多适配。拿安卓用户举例,用户进入安卓系统【设置】-【无障碍】-【屏幕阅读器】使用TalkBack服务,讯飞输入法就会提供语音反馈。
在语音指示下开启无障碍模式后,讯飞输入法的输入面板、菜单面板以及表情面板的屏幕即可随选朗读,即便视力不便情况也能打字,待语音输入完成后输入法会自动朗读,用户便可得知输入结果是否准确,并且进行修改。
此外,无障碍模式下,用户打开文字扫描功能,对着图片或者文本拍照,瞬间文字就能提取出来,识别的文字通过语音播报让视障人群知道。值得一提的是,讯飞输入法也是中国盲人协会认证的首个输入法产品,获得了中国盲人协会颁发的无障碍认证证书。
11年征程,“用人工智能建设美好世界”
从2010年成立至今,讯飞输入法已经走过了11年的历程。
2010年10月28日,全球首款基于云计算实现的语音输入法--讯飞输入法正式发布;
同年,讯飞AI研究院就将GMM-hmm-隐马尔可夫模型应用到语音识别系统中,通过运用WFST解码器,提高复杂的语言模型,达到了70%识别率。
2012年,讯飞又在输入法中使用了深度神经网络技术,把全球首个中文云识别的DNA上线到产品中,使得语音识别率一下子提升了到80%。2018年 ,讯飞又开始使用HybridCNN 算法,通过结构优化大幅提升并发路数,语音识别准确率突破98%。
2020年,讯飞又在产品中加入了动态自适应编解码语音识别引擎 ,进一步实现了多模态输入和领域个性化识别。
疫情期间,讯飞输入法在10天内上线了武汉话转普通话功能,开放给驰援武汉的医生、护士,助力医患团队沟通,累计服务了3万人。
除方言外,讯飞输入法还在持续发展“个性化语音”功能,2012年便在行业内首创了个性化语音识别,允许用户将本地的人名,自己定义的专业词汇,特有词语,上传到云端进行机器学习。用户下次说到这些词语时,讯飞输入法就可以把相应的词语识别出来。
如今,在5G和Alot的技术大背景下,讯飞输入法也在不断进步以适应人机交互和万物互联的世界。讯飞输入法此前推出10.0版本上,就搭载了“动态自适应编解码语音识别引擎”,新增的唇形辅助输入,能够提高嘈杂环境及近距离多人说话的识别效果。
该版本还优化了领域词识别,可更精准的匹配游戏、医疗、旅游、购物等不同的场景词汇。除了语音功能边界的拓展,讯飞输入法10.0版本还基于“免切换”的理念,实现英文单词连续手写,即在输入面板既可以手写汉字也可以直接手写完整的英文单词。
而此次完全离线版本的出现,说明讯飞输入法在发展技术的同时也在注重保护用户的数据和隐私安全,真正切切为用户考虑更多。
(李显杰 )