本文作者:访客

杀疯了!字节豆包视觉理解模型价格下降85%,火山引擎谭待:现在不太关注市场竞争_ZAKER新闻

访客 2024-12-18 19:59:51 20344
杀疯了!字节豆包视觉理解模型价格下降85%,火山引擎谭待:现在不太关注市场竞争_ZAKER新闻摘要: (图片来源:钛媒体 AGI 编辑林志佳拍摄)字节跳动的豆包大模型及相关产品超出预期的表现持续引发行业关注。钛媒体 AGI...

(图片来源:钛媒体 AGI 编辑林志佳拍摄)

杀疯了!字节豆包视觉理解模型价格下降85%,火山引擎谭待:现在不太关注市场竞争_ZAKER新闻

字节跳动的豆包大模型及相关产品超出预期的表现持续引发行业关注。

钛媒体 AGI 获悉,12 月 18 日火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型、豆包 3D 生成模型,以及全面更新的豆包通用模型 pro、音乐模型、文生图模型等,为企业提供多模态大模型能力。

值得一提的是,火山引擎总裁谭待宣布,豆包视觉理解模型输入价格仅为 0.003 元 / 千 tokens,1 块钱可处理 284 张 720P 的图片,比行业价格便宜 85%。

会后,谭待对钛媒体 AGI表示,当前字节并不关注市场竞争,因为大模型市场仍处于早期阶段,更多需要的是场景、需求是否被满足。长期来看,大模型 C 端和 B 端、虚拟和现实世界场景都应该是齐头并进发展,而非 " 半头热 "。

" 我觉得局部会有一些竞争,但这不是关键,最关键是你能不能把这些东西做好,能把成本做低,能不能把方案、落地应用做好,这样企业和用户能够用起来。我们年初发布大模型,但是你很少听到业界有谁用起来、用得很好,而 5 月份豆包发了之后,我们首先把成本做了很大降低,效果也做了很大提升,其实这半年大家才能看到更多市场上反馈模型的声音,在 To b 的领域,大家都是有竞争,也有合作的,我觉得很正常,主要还是大模型价值非常大,空间也非常大,然后还在增长。" 谭待强调,火山引擎就朝着做中国大模型领域、新的技术变革第一名进行发展。

事实上,在与美国 OpenAI 的竞争中,从模型层,到软硬件协同推进,字节跳动已站稳 AI 大模型头部地位。今年 11 月的全球月活跃排行榜上,豆包 App 的 MAU(月活跃用户数)接近 6000 万,仅次于 OpenAI 的 ChatGPT,位列全球第二;截至目前,豆包大模型日均 tokens 使用量超过 4 万亿,发布 7 个月以来增长超过 33 倍。

同时,字节跳动旗下创作工具剪映和 CapCut,全球月活用户也已超过 8 亿,并且在 2024 年实现收入增长超 100%,总收入接近 100 亿元。张楠表示,即梦愿景是 " 想象力世界的相机 "。

另外,字节跳动在 AI 人才投入、算力投入、基于扣子的 Agent 智能体、MaaS 等 AI 软硬件领域的服务都进行全方位布局。

火山引擎总裁 谭待

那么,随着 OpenAI 大模型更迭放缓,Scaling Law 和预训练出现 " 停滞 " 现象,字节跳动能否推动火山引擎成为全球 AI 领域的新 " 领头羊 "?

豆包 " 全家桶 " 年末更新,视觉理解模型价格便宜 85%  

2024 年圣诞节之前,豆包大模型和相关服务终于迎来今年最后一次的重磅更新,下面钛媒体 AGI 梳理:模型家族、场景示例和价格优势、豆包大模型应用、火山方舟大模型平台四个部分进行介绍。

1、模型家族:豆包视觉理解模型、豆包 3D 生成模型,以及全面更新的豆包通用模型 pro、音乐模型等。

今天公布的豆包视觉理解模型,目前已经接入豆包 App 和 PC 端产品,支持教育、电商营销等多个场景,提供极具性价比的多模态大模型能力。豆包视觉理解模型千 tokens 输入价格仅为 3 厘,一元钱就可处理 284 张 720P 的图片,比行业价格便宜 85%。

豆包 3D 生成模型,是与火山引擎数字孪生平台 veOmniverse 结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。

此外,豆包通用模型 pro 也全面升级,对齐 GPT-4o,使用价格仅为后者的 1/8;音乐模型从生成 60 秒的简单结构,升级到生成 3 分钟的完整作品;文生图模型 2.1 版本,更是在业界首次实现精准生成汉字和一句话 P 图的产品化能力,该模型已接入即梦 AI 和豆包 App。

此外,钛媒体 AGI 了解到,字节豆包新一代视频生成大模型将明年 1 月正式提供服务。此外,抖音旗下图片和视频生成工具——即梦 AI,也新增新一代图片生成模型和动态海报功能。

2、场景示例和价格优势

字节跳动和旗下火山引擎正在加速大模型场景落地。据悉,豆包大模型已经与赛力斯、东风等 80% 主流汽车品牌合作,并接入到多家手机、PC 等智能终端,覆盖终端设备约 3 亿台,来自智能终端的豆包大模型调用量在半年时间内增长 100 倍。

与企业生产力相关的场景,最近 3 个月,豆包大模型在信息处理场景的调用量增长了 39 倍,客服与销售场景增长 16 倍,硬件终端场景增长 13 倍,AI 工具场景增长 9 倍,学习教育等场景也有大幅增长。

谭待认为,豆包大模型市场份额的爆发,得益于火山引擎 " 更强模型、更低成本、更易落地 " 的发展理念,让 AI 成为每一家企业都能用得起、用得好的普惠科技。

3、Agent 和豆包大模型应用

此次活动上,豆包 AI Agent 智能体应用成为关注焦点。

火山引擎升级了火山方舟、扣子和 HiAgent 三款平台产品,帮助企业构建好 AI 能力中心,高效开发 AI 应用。

谭待发布了扣子 1.5 版本,支持 GUI 搭建界面,并一键发布为小程序、H5、API 等多种应用形态。目前,扣子 1.5 版本已有超过 100 万活跃开发者,发布超过 200 万个智能体。

4、火山方舟大模型平台

会上,火山方舟首次发布大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本,同时火山方舟还新增全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。

基于 AI 云原生的理念,火山引擎推出了新一代计算、网络、存储、安全产品。其中,存储上,新推出 EIC 弹性极速缓存能实现 GPU 直连,使大模型推理时延降低至 1/50、成本降低 20%。

目前,火山引擎拥有底层基础设施和技术架构,中层豆包大模型家族,上层火山方舟、扣子、HiAgent 等构建的 AI 应用开发平台,从而形成字节在 AI 领域的全方位布局和商业落地。

谭待认为,下一个十年,计算范式应该从云原生进入到 AI 云原生的新时代。

AI 产业进入 " 深水区 ",火山引擎是否已迎来 "OpenAI 时刻 "?

当前,全球生成式 AI 赛道已经进入了 " 深水区 ",竞争激烈,而持续领先的 OpenAI 如今却开始 " 掉队 "。

奥尔特曼(Sam Altman)宣布的 12 月 5 日开始为期 12 天的 "OpenAI 12 日 " 活动,已进展到第 9 天,但其新产品的热度和吸引力,却都被谷歌的大模型 Gemini2.0、量子计算芯片 Willow、视频模型 VEO 2 等所取代。

这意味着,ChatGPT 发布两年之后,谷歌迎来了他的 "OpenAI 时刻 ",技术创新差距越拉越小,且谷歌 AI 视频模型 VEO 2 效果隐隐超越 Sora。

公开数据显示,谷歌预计 2024 年每个季度的资本支出都在 120 亿美金以上,全年同比增长 49% 以上,主要用于 AI 基础设施方面;微软也持续扩大 AI 投资规模,季度资本支出超过 140 亿美元;而 Meta 今年全年资本开支从 300 亿 -370 亿美元上调到 350 亿 -400 亿美元,以建设数据中心来支持 AI 业务。

因此,随着 Scaling Law 出现放缓,同时谷歌、微软、Meta 等大科技公司加大对 AI 领域的资源投入力度,AI 大模型进入了应用和商业落地阶段,OpenAI 巨大的产品先发优势正慢慢消退,大模型与 OpenAI 变得没有特别大的差距了。

回到国内,自 2023 年起,作为国内云与智能提供商,字节跳动的火山引擎持续加大在 AI 人才、AI 算力、To B 商业化、AI 智能体应用等多层面、全方位布局。基于豆包大模型更强模型、更易落地、更低价格特点,如今已提供火山方舟大模型服务平台和解决方案,助力客户提速增效。

2023 年 11 月,字节跳动成立 Flow 部门,Flow 团队成立后,字节跳动在大模型领域的架构基本确立,即 Seed 团队主攻大模型研发领域;Flow 团队聚焦于 AI 产品应用开发工作;Stone 团队承担技术支持职能。

同时,过去一年,豆包还在国外同步推进 AI 应用布局,持续在全球推出十多款基于 AI 和大模型技术的产品,构建 " 超级 AI 应用工厂 ",实现国内外 AI 模型与应用的 " 双向复制 "。

(来源:天风证券研究)

如今在 B 端商业化层面,基于豆包大模型的技术能力,火山引擎已经宣布与 30+ 行业外部企业深度共创豆包大模型商业落地,在零售、游戏、汽车、教育、医疗、企业服务等领域助力客户提速增效。

C 端层面,豆包 App 日活 900 万、月活 6000 万,已经成为中国消费者首选的 AI 应用。尽管基于大模型训练此类应用的成本很高,但字节跳动尚未宣布任何将豆包在 C 端商业化的计划。

谭待对钛媒体 AGI 表示,当前端侧 AI 商业化还未完全成熟。" 端模型现在主要靠芯片,芯片现在还不成熟,所以现在讨论这事是为时太早。"

谈及 Agent 发展,谭待认为," 从 B 端角度看,当前 Agent 做的其实是不够的,因为 AGI 的价值在于他能替代、辅助人多长时间的工作,如果他辅助人是一分钟的工作,比如说帮你写首打油诗,这个就价值不大。当然智能客服价值是比较大的,而我觉得今年其实还没有那么高的 Agent,明年会有一些突破。"

" 我觉得最核心还是技术要好。应该说什么时候切入,这都是表象,你东西不行,怎么切都切不进去。因为这个账很好算,你用人家做的东西,跟我原来用人或用原来系统做的一比较,效果能不能更好,而且成本还能否更低,你就把这个做到了,你怎么切都切得进去。" 谭待随后补充称,未来十年,AI 云原生将是很大的机遇,今天还是初期阶段,未来基础架构会发生变化,从互联网到 AI 进行眼神," 我想火山应该做成这一领域的领军企业。"

谭待曾指出,作为国内第一个把模型成本做到每千 token 低于一厘钱的企业,火山引擎的豆包大模型推动大量的创新应用随之不断涌现,模型调用量突飞猛进,大家共同努力让应用的生态更加繁荣。

据研究机构 IDC 预测,到 2030 年,AI 将为全球经济贡献 19.9 万亿美元,推动 2030 年全球 GDP 增长 3.5%。这意味着,AI 是全球经济增长的新引擎。

在演讲结尾,谭待强调," 今年是大模型高速发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。通过 AI 云原生和豆包大模型家族,火山引擎希望帮助企业做好 AI 创新,驶向更美好的未来。"

(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)

阅读
分享