1. 首页 >> ChatGPT教程 >>

深度丨ChatGPT后,百度匆匆交卷,科大讯飞将“星火”燎原?

chatgpt中文版 http://chatgpt.guige.xyz 

撰文:开叔 | 图源:互联网 


在ChatGPT发布并引发一系列连锁反应后,很多人期待国内能够诞生一款可以与之媲美的AI大模型利用。3月16日,百度匆匆“交卷”,但文心一言的表现明显不及用户预期。终究在5月6日,科大讯飞也完成“作业”,而这一次讯飞星火又能否经得起考验呢?


5月6日,科大讯飞正式发布星火认知大模型。发布会现场,董事长刘庆峰重点阐释了星火大模型在七大维度上的能力,并且分享在教育、办公、汽车、数字员工等领域的利用。


与百度区别,这次发布会进行了星火大模型的现场演示,也让观众直观的感受了其表现。


仅从发布会现场,能够看到星火大模型在对话、语义理解等基础能力方面表现尚可,但这好像与发布会后用户的体验其实不一致!



官评与网评的反差




在微博等平台,我们搜索了部份用户的实际体验,很多人仍然给出差评,乃至称其为“人工智障”。


比如有网友发问华为畅享60X相关问题,星火大模型的回答中称该款手机内置4800mAh大容量电池,而这明显与6000mAh的事实不符。发问我父亲和我儿子甚么关系,星火大模型给出的答案居然是父子关系。


更离奇的是,有网友发问“你的开发API哪里可以看到?”,星火大模型的回答居然提供了OpenAI的地址,网友追问“你给的是OpenAI的吧”,星火大模型居然回答“是的,我是由OpenAI开发的”。



为了印证网友的分享会不会属实,我们也进行了实际体验,体验中确切存在类似的问题,经常出现一本正经的胡说八道,比如发问“今天是星期几?”“今天是几月几日”,而这样的问题重复屡次发问也给出了离奇的毛病答案,这着实让人很难接受。


可见星火大模型在逻辑推理上是有较明显不足的,毕竟此类问题其实不复杂。


固然,我们不能仅仅凭仗这少数的问题就简单的给星火大模型差评,还需要更加全面的进行评判。


来自SuperCLUE的认可




5月9日,中文通用大模型综合性评测基准SuperCLUE正式发布,并对市面上主流的支持中文的通用大模型进行了评测与排名,而这可以作为我们评价星火大模型的参考。


排名中,GPT⑷不出意料的遥遥领先,而星火大模型次于GPT⑶-turbo排名第三,另外,百度文心一言排名第九



具体从评分维度上来讲, SuperCLUE是从基础能力、专业能力和中文特性能力,三方面给出评价。


  • 基础能力:包括了常见的有代表性的模型能力,如语义理解、对话、逻辑推理、角色摹拟、代码、生成与创作等10项能力;

  • 专业能力:包括了中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等50多项能力;

  • 中文特性能力:针对有中文特点的任务,包括了中文成语、诗歌、文学、字形等10项多种能力。


而星火认知大模型的总分为53.58,三个维度的得分分别是74.00、44.00、42.73。



基础能力方面,星火大模型与GPT⑷相比,差距较大的有生成与创作、逻辑与推理、代码,这三项。


特别是逻辑与推理的得分只有30,远低于GPT⑷的90,这也与前文所描写的“一本正经胡说八道”一致。



而更让人惊讶的是中文特点能力方面,星火大模型的得分远低于GPT⑷,比如字义理解、对联、方言、歇后语和谚语、汉字字形和拼音理解、古文等。


作为国产的AI大模型,在其他维度上逊色于GPT或许是可以理解的,但是在中文特性能力上仍然有如此大的差距着实让人难以接受。



综合上文的案例和SuperCLUE的评测,我们确切能够感遭到讯飞星火大模型有明显的不足,或说和ChatGPT有差距,但这一切都不是我们否定星火,否定科大讯飞的理由。


辨别式→生成式




在这个以ChatGPT为代表的大模型风行确当下,我们首先要认清一个事实:人工智能发展至今,并不是一直默默无闻,ChatGPT也代表不了人工智能。


之所以当下ChatGPT能够引发全部社会的关注,并将人工智能推上神坛,在于其将人工智能从幕后带到了台前。正如百度开创人李彦宏所说,人工智能正从辨别式走向生成式,AIGC成为新方向。


所谓的辨别式人工智能,指的是分辨内容跟需求匹配不匹配,主要是在辨别;生成式人工智能,指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。


而科大讯飞正是在过往的辨别式人工智能领域具有重要地位,特别是语音辨认,和语音合成、机器翻译、图文辨认、图象理解、浏览理解等等众多领域。



纵观其发展历程,科大讯飞在2014年正式启动“讯飞超脑计划”,研发基于类人神经网络的认知智能系统;2022年提出讯飞超脑2030计划,进一步深耕认知智能,并承办国家语言及语言国家重点实验室等多项工作,成为AI领域的“国家队”,12月15日启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。


可见,科大讯飞不但在辨别式人工智能时期占据重要的一席之地,在生成式人工智能赛道也已出发,虽然当下拿出的星火大模型不尽如人意。


科大讯飞的窘境




固然,在人工智能转型确当下,并不是只有百度和科大讯飞参与其中,在大模型方面,几近国内巨头全员出击,比如百度文心一言、华为盘古、阿里巴巴通义千问、腾讯混元、商汤科技日日新等等。


另外,各路大佬也不甘人后,包括李开复、王兴、王慧文、王小川、张一鸣等等,都在摩拳擦掌。


纵使科大讯飞在语音语义相关技术方面实力雄厚,但其他企业也各有优势,比如百度的综合实力就十分强悍,包括NLP、图象辨认、自动驾驶等。科大讯飞要想在后续的角力中实现突破绝非易事。


除剧烈的行业竞争外,科大讯飞的事迹表现让人耽忧


4月20日,科大讯飞发布2022年及2023年第一季度财报。


数据显示,2022年科大讯飞公司实现营收188.20亿元,同比增加2.77%;净利润5.61亿元,同比降落63.94%;扣非后净利润4.18亿元,同比降落57.31%。



2023年第一季度,公司实现营收28.88亿元,同比降落17.64%;净亏损5789.53万元;扣非后净亏损3.38亿元。


关于事迹下滑的缘由,财报中提到,一方面是由于社会经济的特殊环境,另外一方面是被被列入美国实体清单后,2022年被再次极限施压,从供应链到相关的合同签署需要调剂的进程,也影响了当期定单签订的节奏。还有公司持股的三人行、寒武纪、商汤等金融资产因股价波动致使公允价值变动收益金额较上年同期减少 5.82 亿元等。


但与此同时我们也看到,科大讯飞的营收表现不佳缘由还有很多,比如其业务占比最大的教育领域面临的剧烈竞争。最近几年,随着学生对交互性强的AI学习机需求增大,众多企业发力,步步高、读书郎、网易有道等实力不容小觑。


另外,其他多项业务盈利能力不足,和依赖政府补贴等问题都制约着科大讯飞的发展,这样的局面亟需一个新的机遇来改变。而大模型,或说星火认知大模型就是这样的一次机遇。


“星火”能否燎原?




回到讯飞星火认知大模型,在2022年12月15日,科大讯飞启动“1+N”认知大模型专项攻关,其中“1”指通用认知大模型,“N”指大模型在教育、办公、汽车、人机交互等各个领域的落地。


如今作为“1”的星火大模型已发布,其由7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。虽然其实际表现还有很多不足,但毕竟勇于让广大用户去体验,这一点是值得肯定的。



而接下来“N”的落地成了另外一个重点。


发布会上,讯飞董事长刘庆峰介绍了搭载星火大模型的一系列利用,包括教育、办公、汽车、数字员工。具体用例有星火大模型赋能的讯飞AI学习机、讯飞智能办公本、讯飞智能座舱等。


之所以说“N”是一个重点,是由于其决定着商业价值的体现,决定着其能否被市场所认可,决定着会不会能够创造营收。


但同时这也考验着“1”的能力,如果这个“1”没有相当的水准,那末所谓的“N”也只能是空中楼阁。


发布会上董事长刘庆峰宣称,到8月15日,代码能力会上一个大台阶,多模态的交互能力也将正式开放。到10月24日希望星火对标ChatGPT,在中文上要超出ChatGPT,在英文上要到达跟它相当的水平。



豪言放出,但终究或者个未知数。


2021年,科大讯飞董事长刘庆峰曾提出2025年千亿营收的目标,但2022年全年营收仅188.20亿元,同比增加2.77%,2023年一季度营收更是唯一28.88亿元,同比降落17.64%。


过去千亿目标的豪言难以实现,这次又立下flag赶超ChatGPT,人们对科大讯飞的期待会不会要再次落空呢?


我们期待星火在未来能够快速成长,期待了解其更多的技术内容,如果真如其所言,燎原之势便有望达成,只是从当下来看这条路充满曲折。


毕竟大模型的研发不是抱佛脚就可以实现逆袭的,需要延续的研发投入,而这对营收窘境的科大讯飞来讲是一个困难。同时需要高质量训练数据集,充分的算力资源,深度的学习框架等等。另外,在与BAT和更多竞争对手的疯狂比拼中,科大讯飞并没有明显优势。



但总之,科大讯飞星火认知大模型的发布成为又一颗被埋下的种子,孕育着希望。


ChatGPT诞生并风行以后,很多人感叹国内AI的后知后觉,认为我们又将堕入长时间的被动,但我其实不这么认为,或许ChatGPT是那个星星之火,但燎原之势已在国内燃起,只是需要再给一些时间和信任。




-------------------------------


往期推荐
01

10地区300亿!元宇宙产业基金释放新机遇

02

与元宇宙有关的七大加密货币

03

Solana简史:从市值5400亿到众叛亲离

04

五一,淄博烧烤靠谱、成都元宇宙拉胯?

05

解读《浙江省元宇宙产业发展2023年工作要点》



关注元力社 畅游元宇宙


合作交换

吴经理:18600365673




请让我知道你在看

桂\哥\网\络www.guIGege.cn

本文来源于chatgptplus账号购买平台,转载请注明出处:https://chatgpt.guigege.cn/jiaocheng/29794.html 咨询请加VX:muhuanidc

联系我们

在线咨询:点击这里给我发消息

微信号:muhuanidc

工作日:9:30-22:30

X

截屏,微信识别二维码

微信号:muhuanidc

(点击微信号复制,添加好友)

打开微信

微信号已复制,请打开微信添加咨询详情!