近日,讯飞星火V4.0震撼发布,携科研助手升级版强势登场。此次迭代,讯飞星火精准聚焦机器学习建模在多模态交互中的挑战,对功能架构、用户交互及系统性能进行了全方位革新与优化,显著提升了研发效率,使得认知模型平台愈发强大。尤为值得关注的是,星火能依据用户语言描述,融合空间与常识推理,精准定位对象位置,这一飞跃性进展对推动未来机器人及具身智能产品的智能化进程具有深远意义。
在图文识别上,讯飞星火大模型V4.0能力也进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。
从国内外12项大模型主流测试集的结果来看,讯飞星火在8个测试集中排名第一,在七大核心能力上全面超越了GPT-4 Turbo。
自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次。科大讯飞方面公布的数据显示,今年618期间星火大模型加持的智能硬件销量同比增长超70%,月均使用次数超4000万。
面向未来的人工智能新生态,科大讯飞董事长刘庆峰强调要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地。
基于讯飞星火大模型V4.0的能力,科大讯飞同时发布并升级了多款应用。
在个人领域,科大讯飞推出了“个人空间”。用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。
在教育领域,科大讯飞发布了首款星火智能批阅机。这款机器集智能批改、精准学情、个性学习于一体,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,还为老师作业讲评和面批辅导提供了素材。
科大讯飞研究院院长刘聪现场演示了星火智能批阅机批改作业的全流程,15份学生作业半分钟就能批改完成,批改模拟了真人笔迹,和老师平时批改作业几乎一样。
通过自动化识别,星火智能批阅机试题解析的准确率大于99%,学生可以随便涂抹,自由排版不限格式。原先要90分钟才能批改完的作业,现在只要5分钟就能完成,学生的错题解决率也从50%提升到73%。
面向万物互联时代,星火语音大模型发布国际领先的多语种多方言免切换语音识别技术,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,输入效率大大提高。
基于星火V4.0强大的多语种支持能力,科大讯飞发布软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写的困难,即使在三人混叠说话场景也能实现86%的语音识别准确率。未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。
同时赋能行业,发布星火企业智能体平台。围绕搭建智能体的三大关键能力,当前企业智能体平台已覆盖400+AI原子能力,集成90+外部信源,打通100+内部IT系统,可供企业结合业务场景快速构建可落地的智能体应用。平台围绕生产域、科创域、办公域、管理域上线32个企业智能体,供企业即插即用。
讯飞星火大模型带来行业赋能的同时,也在助力开发者生态蓬勃发展。自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。越来越多开发者正加入星火生态,释放更多刚需场景的应用价值。
科大讯飞倡导AI发展需有序战略引领,呼吁政府、行业协会及组织强化数据安全立法,促进行业共识与标准建立。随着AI快速迭代,企业渴求高效的技术解决方案,技术亦需企业场景验证,算法优化离不开业务实践。因此,跨界合作至关重要,通过这种合作,我们可以确保AI技术的健康和可持续发展,造福社会。