各大模型在高考中表现如何?科大讯飞星火数学题正确率50% 排名第一-天天信息
2023-06-09
快科技 2023-06-09 15:54:36
(资料图)
快科技6月9日消息,科大讯飞于今日举办讯飞星火认知大模型V1.5 升级发布会,正式发布讯飞星火认知大模型V1.5,该模型的开放式问答能力取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升。
发布会上,科大讯飞展示了大模型在今年高考中的答题能力,科大讯飞星火力压群雄,成为了解题正确率最高、“最聪明”的AI大模型。
数学题目测试中,媒体选择了数学高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。
测试结果显示,这五款大模型在答数学题的能力上差异显著。
最“聪明”的讯飞星火答对了5题,正确率50%,大模型数学能力排名第一。百度文心一言和ChatGPT“紧跟其后”,答对了4题,正确率为40%。
而在语文主观作答中,ChatGPT高考作文得分最高,文心一言、讯飞星火得分稍低,但跟ChatGPT处于同一水平。至于英语考试,讯飞星火、ChatGPT显著领先其它各家。
此外,值得关注的是,在今日讯飞星火大模型V1.5迭代升级后,其数学能力将会再上一个台阶。