IT之家 6 月 11 日消息,科大讯飞今年 3 月推出了讯飞星火大模型 V3.5,而讯飞星火 V4.0 将于今年 6 月 27 日正式发布。
科大讯飞董事长刘庆峰在公司成立 25 周年司庆活动上透露,讯飞星火 V4.0 发布时将展示最新的端到端智能语音落地成果,同时公司的端到端的语音技术建模方案也排在计划中,预计三季度推向市场。
除此之外,科大讯飞还将提供 GPT-4o 没有的一句话复刻、高噪音场景语音识别、多方言多语种免切换功能。
在刘庆峰看来,OpenAI 发布 GPT-4o 对万物互联时代语音浪潮的推动,类似于当年 Siri 对语音应用的推动。它备受关注的原因有几个点:超拟人合成,使得说话不再是朗读腔调,而是真的像人一样自由对话;全双工交互,可以同时(瞬时)进行信号的双向传输,人机对话可以随时打断和继续;通过语音到语音的端到端建模,实现快速反应的极致交互体验。
据介绍,目前科大讯飞在超拟人合成技术方面,中英文、多语种都做到了国际领先。全双工技术方面,端到端的语音技术,背后有语音识别、文本生成、语音合成的过程,这些技术将在公司 6 月 27 日将发布的讯飞星火 V4.0 中得到体现,IT之家届时将为大家带来详细报道。
刘庆峰表示,在 5 月底上线的讯飞星火 V3.5 Max 版本,已在文本生成、知识问答、逻辑推理、数学能力上超越 GPT-4 Turbo 0429 的最新版本。
他还指出,大模型时代科大讯飞核心战略组成包括:
第一,赋能现有的软硬件和行业产品,形成基本盘。背靠科大讯飞的根据地业务,深入教育、医疗、工业、汽车、家电等行业赛道,同时打造基于大模型的翻译机、学习机等王牌硬件产品。
第二,开拓以央国企为代表的重点行业客户市场,提供真正解决行业和企业刚需的方案。
第三,开辟新兴赛道的软硬件一体化授权和新硬件机遇。比如机器人硬件、医疗硬件等。
第四,在万物互联时代,AI 助手的入口级战略机遇。
第五,推进“讯飞超脑 2030”计划,迈向家庭陪伴机器人的万亿市场。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。