您现在的位置是：理财鱼 > 理财方法 >

理财方法

大模型们背后的“小算盘”

发布时间：2023-05-07 09:34理财方法次评论

厄尔尼诺指数快速增加，史上最热夏天即将到来，但比气候更“火热”的是科技互联网行业的大模型淘金潮。

今年年初，各方大佬下场创业打响了淘金热的第一枪，紧接着的是3月开始的大厂扎堆布局，连高校与国家队都争取跑步入场，淘金热愈演愈烈。5月6日，我们又迎来了一位玩家入场，科大讯飞发布旗下认知大模型星火。

兴许是大众与业界对于密集发布的大模型有些“脱敏”，讯飞星火发布的消息未能引起行业的热烈反响。如今的局面其实并不意外，因为商业社会的发展总是需要新的故事。早在今年2月，ChatGPT的出圈就为AI板块的科大讯飞狠狠地拉了一波股价，GPT概念股至今仍广为投资者所关注。

据了解，“星火认知大模型”是纯文本模型，仅支持文本内容的输入和输出，多模态交互需要自升级产品星火Pro获取。而通过TTS（从文本到语音）实现语音提问功能可以说是意外之喜，也是科大讯飞有别于一众大厂的特点之一。

此外，本次发布会与此前各家大模型发布会最大的不同在于，科大讯飞CEO刘庆峰为大家“画了一张带有时间线的大饼”：6月9日前，讯飞星火大模型将突破开放式问答，实现对话能力和数学能力的再升级；8月15日前代码能力会上大台阶，多模态交互能力再升级，在10月24日前，星火大模型将对标ChatGPT，在中文能力上超过ChatGPT，在英文能力上与ChatGPT相当。

这是一个管理预期的故事。

回顾近十年的商业新故事，其中既有智能手机、新能源、云计算等光环（aura）加身的神话，也不乏元宇宙、NFT这类被祛魅后步入暗夜的案例。每一个故事在开始之时都宣称将开启一个新时代、新纪元，宏大的叙事为其披上克里斯玛的外衣，等待其进入商业场景后被市场验证。

反观科大讯飞，大模型是它不得不抓住的光环。

大模型是AI赛道重新洗牌的机会已是共识。而且自科大讯飞近年来的业务发展路线看，其引以为傲的语音识别赛道受困于创新者窘境，视觉领域也有AI四小龙后来居上，尝试拓展的智慧医疗、智慧金融业务的表现也只是不够出彩，在2022年整体营收中占比均不足3%。

回归大模型本身，随着迄今为止人类历史上用户增长速度最快的ChatGPT不得不关闭付费渠道，一场属于科技互联网的“西进运动”俨然开始进入中场。

现在我们离GPT还有多远？

LLM（大语言模型）、Token(文本单位)、参数，为4月内几乎未曾间断的大模型发布会所吸引的VC们一面接收这场宝贵的知识爆炸，一面摇身一变成为AI领域的深耕者。按本山大叔的话来说，就是“聪明的智商又占领高地了”。

先行的创业者们早早通过自身过硬的攒局能力拉来了数轮融资，后来的创业者们也在抓紧忽悠风投上车，勇立时代潮头一起吃肉喝汤。

只是直到目前，无论是最早发布的大模型文心一言还是后续开放测试或在发布会上实机演示的大模型都距离ChatGPT存在一定距离，包括5月6日发布的科大讯飞星火。

星火发布会上，刘庆峰现场演示星火的能力并提出了评测大模型的覆盖7大类481个细分任务类型。尽管真机实测勇气可嘉，测试内容出错较少且响应快速，整体的情感理解与逻辑线也都在线，但整体测试类别还是以简单的文字生成为主。这一块基本属于科大讯飞的传统艺能，并不能看出自去年12月起至今近6个月的数据投喂成果。

换句话说，目前的生成内容还无法看出星火达到了智能涌现的标准。不过考虑到科大讯飞的数据要素来源主要在于教育、医疗、汽车等细分领域，目前的表现也就不难理解了。

本次发布会上科大讯飞还展示了星火搭载下的学习机、虚拟人、汽车座舱域智能办公演示，这既是亮点也是槽点。亮点在于星火大模型在诞生之初就已经找到了明确的商业化落地路径，其中教育硬件与办公硬件也是科大讯飞过去两年内的营收主力；槽点在于这几条路径相对于大模型而言显得过于狭窄，可能是星火在测试时所表现出的能力还尚未达到赋能千行百业的水平。

不过，学霸未尝就是未来混得最好的。在大模型竞争剧烈的当下，率先占领垂直领域应用的高地并进入自我造血反哺大模型训练的良性循环，未尝不是一条可行的路径。

更值得注意的是，刘庆峰在发布会结束后透露，星火大模型的算力硬件主要由华为提供，当前并未受到限制。

由此我们也不难看出，一是自身是否有算力储备在大模型训练中也许没那么重要，尤其是并不是所有人都将大模型定位于“通用”级别的时候。相反，数据要素的重要性更加凸显，这在当初百度、阿里等坐拥多领域高质量语料的头部大厂发布大模型时尚不明显，如今科大讯飞在教育领域的演示成果与泛领域演示成果的鲜明对比足以说明数据的重要性。

二是“送水人”式的“技术商人”路径在大模型井喷的当下切实可行。一方面送水人可以通过租售算力甚至训练方法，在获利的同时解决算力冗余，另一方面收水人也可以节约大模型训练的成本，杜绝内卷和重复基础设施建设，让大模型相对不再那么“重资产”。

在刘庆峰的规划中，星火将在10月24日达到中文能力超越ChatGPT，英文语料能力相当。且不论对标的是GPT3.5还是GPT4，我们不妨以此时间为节点，到时候再审视国内大模型与OpenAI的差距，是越来越小还是越来越大。

祛魅大模型

讯飞星火的发布从一方面也可以看做是从李开复理解的AI 1.0演进为AI 2.0，是从NPL（自然语言处理）、CV（计算机视觉）到海量数据喂养下具备跨领域知识与智能交互能力的大模型。这是在李开复万字演讲中广为流传的"AI 2.0"范式。

有能力者做通用大模型，稍有欠缺者如科大讯飞，也要根据自有业务线如医疗、教育等场景做规模稍小的大模型。这是一个足够宏大的叙事，尤其是在国内多位大佬呼吁将所有应用接入大模型重做一遍的话术，充满了即刻为一项技术突破迅速找到场景进行商业化落地的渴望。

如今的火热场景我们并不陌生，近年来，我们为了便于传播与理解，往往会以序列号化的话术来形容技术范式的迭代演进。意义建构理论的学者认为，这是将信息的寻求与使用视作一种沟通实践模型，帮助人进行信息接收的做法。

从互联网泡沫后提出的Web1.0和Web2.0到通信领域的4G和5G，以及AI领域，序列号给人以最直白的观感，为我们带来无限的想象空间，这个视角下的技术可以在草蛇灰线之中无限升维演进。越是这样带有技术革命色彩的故事，越是能吸引关注与投资，越具备商业化落地的可能性。

只是能否落地却是未知数，就像大模型涌现现象的发生概率只有0%和100%。

>相关《大模型们背后的“小算盘”》内容：

1、首批将应用于教育、汽车等领域，科大讯飞发布讯飞星火认知大模型 | 科技前线

钛媒体App 5月6日消息，科大讯飞发布讯飞星火认知大模型。现场，科大讯飞演示了大模型的七项核心能力，包括：语音输入，实时互动、文本生成、语言理解、知识问答、逻辑推理和数学能力，并展示了其在教育、办公、汽车、数字员工四大行业应用成果。科大讯...【继续阅读】

2、讯飞星火认知大模型发布年内还有这些AI大事件

智通财经APP获悉，讯飞星火认知大模型成果发布会于5月6日下午召开，讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等应用成果也同步发布。国联证券发布研究报告称，大模型技术可以在数据和应用层面形成良好协同，对相对成熟下游领...【继续阅读】

3、大模型之战，科大讯飞姗姗来迟？

自ChatGPT火爆，科大讯飞的存在感就水涨船高，连发布大模型都预告了一遍又一遍，5月6日，科大讯飞终于有了干货，正式发布讯飞星火认知大模型，以及在教育、办公、汽车、数字员工四个行业的应用成果。或许是因为已有了百度的文心一言、阿里的通义千问等先...【继续阅读】

理财方法

大模型们背后的“小算盘”

>相关《大模型们背后的“小算盘”》内容：

相关文章