6月27日,基于全国首个国产万卡算力集群“飞星一号”讯飞星火大模型V4.0正式对外发布。七大核心能力全面升级,全面对标GPT-4 Turbo,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现整体超越。在国内外12项大模型主流测试集中,讯飞星火在8个测试集中排名第一,国内大模型全面领先。
同时图文识别能力进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外,讯飞星火的长文本能力也得到飞跃性提升,针对长文档知识问答的幻觉问题,业界首发溯源功能。
现场,刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果,讯飞星火“智商”再度进化。
以空间推理为例,“Bob在客厅里。他拿着一个杯子走到厨房。他把球放进杯子里,然后拿着杯子走到卧室。他把杯子倒过来,然后走到花园。他把杯子放在花园里,然后走到车库。问题:球在啥地方?”讯飞星火可以基于空间和常识推断出球在卧室的地面上,这些能力的进步对于以后的具身智能、家庭机器人都具有意义。
不过,刘庆峰也表示, 大模型在给我们的工作、生活带来便利的同时,也存在各家生成内容差不多、生成内容较泛、不够实用的情况,怎么样才能让大模型更好用,在工作生活中形成独特的价值,成为“更懂你的AI助手”?对此,科大讯飞给出了答案。
刘庆峰提出,AI助手要能够基于用户画像进行个性化表达,基于使用历史进行记忆学习,基于个人资料做增强学习。在构建用户个人画像时,人设风格能自己选定,也能够准确的通过对话和使用历史动态完善,进而形成个性化的表达风格;AI助手再结合个人资料,就可以生成个性化和针对性内容。
基于此,讯飞星火APP及桌面版全新升级改版,率先发布“个人空间”,用户都能够上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。
科大讯飞研究院院长刘聪现场演示“个人空间”效果。当他上传了女儿写的小作文并选取符合女儿风格的AI人设标签后,讯飞星火生成了一篇活泼、可爱更个性化的文章;当他上传了讯飞翻译机的产品海报、用户短视频、相关录音,讯飞星火也能够准确的通过这些多模态信息生成产品培训文档,还可以对生成的信息进行多模态溯源。
讯飞星飞V4.0“个人空间”的上述特性,使得大模型郑重进入个性化时代,工作、学习“可用性”飙升!
此外,星火大模型还打通了全系讯飞C端软硬件产品生态,数百万智能硬件用户一键拥有“星火全家桶”。
比如讯飞智能办公本、智能录音笔的文件可以一键同步到星火个人空间中,通过数据互通、操作联动,把一篇办公本里会议记录同步到星火中,就可以让星火进行公文写作,还可以做PPT,以及生成待办事项等,带来更高效的办公体验。
除赋能C端市场,为个人用户打造专属助手外,科大讯飞在此次发布会上还面向B端,推出了星火企业智能体平台,旨在打造每个岗位的专属助手。
星火企业智能体平台围绕搭建智能体的三大关键能力,当前企业智能体平台已覆盖400+AI原子能力,集成90+外部信源,打通100+内部IT系统,可供企业结合业务场景快速构建可落地的智能体应用。平台还围绕生产域、科创域、办公域、管理域上线个企业智能体,供企业即插即用。
基于企业智能体平台,科大讯飞打造了星火商机助手、星火评标助手等典型应用案例,为企业应用打了个样。
星火商机助手能轻松实现商机线索应知尽知、客户拜访提质增效、销售管理智能研判,助力一线销售和商机管理效能提升。星火评标助手通过标前寻源、智能评标、定标审核等功能,智能评标结果人机一致率达98%,投标异常检出率超过80%,在大幅度的提高企业评标效率同时降低采购成本。