学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 理财方法 >

理财方法

大模型慢半拍,字节甘做“嫁衣”?

发布时间:2023-05-05 08:24理财方法 评论

在大模型甚嚣尘上的当下,一向高举高打的字节,却一反常态,低调得让人不太习惯。

当百度、阿里、华为、360等知名互联网公司的一把手们亲自挂帅,为大模型站台,并不吝用“智能化时代的开端”、“科技和商业史上的革命性时刻”来赞誉它时,字节却安静得多。

相关的官宣只有两个,一是4月11日,飞书宣布将推出AI助手“My AI”,二是4月18日,火山引擎推出大模型训练云平台,包括自研DPU(数据处理器)、新版机器学习平台等系列云产品,以服务于大模型创业公司——字节自研大模型始终未露面。

相反的是,火山引擎总裁谭待公开“承诺”,火山引擎不做大模型,将化身赋能者,为大模型客户提供算力等AI基础设施,帮助其做好大模型开发。

此举似乎表明,字节避开了大模型战火,选择以幕后卖水者的身份入局。

只是,在算力、算法、数据这大模型的三要素上均具备优势的字节,为何会选择“韬光养晦”?字节真的会彻底放弃大模型,甘为他人做“嫁衣”吗?

慢一拍的字节大模型

火山引擎不做大模型,或许并不代表字节对大模型无动于衷,这可能是个文字游戏。

实际上,虽然字节从未大张旗鼓得官宣自研大模型,但已经有所部署。

据36Kr在今年2月的报道,字节跳动在大模型上已有布局,会在语言和图像两方面发力,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右;图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

另据《晚点LatePost》报道,张一鸣开始看人工智能论文,且时常会和一些字节人士分享论文心得和对ChatGPT的思考。

这表明,字节并不想缺席这场盛宴,但必须承认的是,字节在大模型上的反应确实有点“迟钝”了。

民生证券4月9日发布的《当大模型不再稀缺》报告显示,国内至少已有30多家大模型亮相。大部分都在3~4月份官宣,比如3月16日的百度“文心一言”大模型,4月8日的华为盘古系列AI大模型,4月10日的商汤“日日新”大模型,4月11日的阿里“通义千问”大模型......

大模型慢半拍,字节甘做“嫁衣”?


而据36Kr报道,字节语言大模型团队今年初才成立,预期今年年中推出大模型,字节跳动相关技术负责人表示,技术中台在这些领域的探索仍处于初期,尚未成熟。

事实上,大模型竞赛的起点并非今天,而在更早的布局,这方面,字节有些晚了。

对比来看,百度、阿里、华为、腾讯等企业的大模型均在2019年~2021年间就已有雏形,比如,百度在2019年发布了文心大模型,阿里在2021年发布了M6大模型,同年华为发布盘古大模型,这些雏形可以视为近期发布的类ChatGPT大模型的“基座”。

而字节方面,虽然其AI布局不算晚,字节AI Lab早在2016年就成立,与腾讯同一年,但其似乎并未在大模型上下足功夫。

据《晚点LatePost》报道,一位字节人士称,在去年底ChatGPT出现前,字节对大模型的投入还比较少,表现之一是,约有100人的字节AI Lab NLP(自然语言处理)组,只有不到10人在研究语言大模型,其他人主要在做翻译和抖音安全等优化。

知乎上一位字节AI Lab工程师的回答也印证了这一点,他表示,字节AI Lab的主要研究方向和业务应用有关,比如抖音特效、视频和图片审核等。

简单来说,字节对AI的探索比较务实,主要服务于自家业务,这种务实而非务远的策略,或许反而成了其布局通用大模型的“阻碍”。

而除了晚一步之外,字节对大模型的野望似乎也不是很大。

据《晚点LatePost》报道,字节语言大模型的探索方向主要与搜索相关,可能会在抖音、TikTok中推出类似微软New Bing的功能;图像大模型则主要服务商业化需求,以帮助字节的广告客户以更低成本制作视频。

另据字母榜报道,有知情人士称,飞书推出的“My AI”背后的大模型是由飞书自行操盘,而非字节大模型团队负责。

从上述信息判断,字节大模型似乎并不打算“大包大揽”,而是与自家部分业务紧密相关,这与百度“文心一言”、阿里“通义千问”等通用大模型有所差别。

比如“文心一言”,在发布会现场,文心一言展示了五个使用场景,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

“通义千问”的功能则包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等,阿里巴巴集团董事会主席兼首席执行官张勇表示,阿里所有业务包括天猫、钉钉、高德地图、淘宝、优酷、盒马等都将接入该模型,应用场景实属广泛。

另一个可以侧面佐证这一点的是,百度和阿里均计划依托自家云平台,向外界开放大模型服务,打造大模型生态。

比如阿里云智能集团CTO周靖人表示,各行各业的生态伙伴都可以对千问大模型进行再训练和精调,打造行业专属大模型;百度智能云事业群总裁沈抖也表示,文心一言的能力将通过百度智能云对外提供服务,会率先在媒体、文娱、企业软件等行业落地,场景包括智能客服、员工培训、巡检日报、知识萃取等。

但字节云却“反其道而行之”,火山引擎宣称只做基础设施服务,不对外输出大模型能力。

这意味着,字节正在探索的大模型定位可能并非是开放生态,而是为了增强现有业务的竞争力。

当然,这只是初期,字节大模型的全貌尚未揭开,在字节官宣之前,还是变数难料。

字节为何甘为他人做“嫁衣“?

值得探究的是,为何字节对百度、阿里那样的通用大模型兴趣不高?火山引擎又为何坚定得不做大模型?

背后原因或许与以下几方面的权衡有关:

其一,通用大模型烧钱,且距离商业落地“遥远”。

训练大模型的一大成本是算力,而算力的关键是芯片,那么,大模型训练需要多少芯片?

参考ChatGPT,美国市场研究机构TrendForce推算称,处理ChatGPT的训练数据需要2万枚A100芯片。网上流传的一份《AI芯片专家交流纪要》显示,如果是对标ChatGPT的大模型,1万颗A100芯片是入门券。

而据国盛证券估算,按单张A100芯片的价格为10万元算,大模型训练需要投入约10亿元。

大模型慢半拍,字节甘做“嫁衣”?


共3页: 上一页下一页

>相关《大模型慢半拍,字节甘做“嫁衣”?》内容:


1、 大模型时代的必要基础 数据要素或为“计算机牛市”的重要推动力

在由中国电子、中国经济体制改革研究会共同主办的第六届数字中国建设峰会数字城市分论坛上,《数据要素市场化配置综合改革白皮书(2023年)》正式发布。 《白皮书》指出,北京、广东、浙江、上海、深圳等省市作为“头雁”已处于数据要素市场化配置综合改革...【继续阅读】


2、 10日大涨137%,中科信息称没有从事通用大模型产品的研发

5月4日,中科信息披露公司股价异动的公告,公司研发的技术与产品与当前的通用大模型、ChatGpt不存在相关性,公司也没有从事通用大模型产品的研发,公司目前与大模型厂商不存在合作。 盘面上,截至今日收盘,中科信息涨超13%,报61.67元。该股近10个交易日...【继续阅读】


3、 字节跳动的“海王”野心

“海王,即‘出海的王者’。” 一位业内人士如是说。 字节跳动的出海之路 9月底,字节跳动的快时尚跨境独立站IfYooou进入了人们的视野中。 其YouTube官方账号介绍道,IfYooou是一家集女装、配饰、家居用品于一体的国际DTC时尚生活网站。 从定位来看,IfYoo...【继续阅读】