文 | 新识研究所
字节 AI 应用正进入加速时刻。
4 月份,字节 AI 部门 Flow 旗下发生人事变动,并将一些业务重合的应用进行整合。AI 社交应用猫箱原负责人梁琛奇离职,由原 AI 生图应用星绘负责人西原 (花名) 接任,且星绘团队计划并入豆包,由豆包 APP 端负责人陆游 (花名) 一起管理。
同一时间,AI 应用开发平台 「扣子空间」 正式启动内测,依托字节生态,办公场景的结构化任务执行效率更高,一上线便受到玩家追捧,被誉为字节跳动版 「Manus」。
5 月份,剪映推出了新一代 AI 营销内容创作平台 「Pippit AI」,悄悄登上周榜第一。又在国内上线了两款 AI 产品,一款是搭载火山引擎的豆包大模型,可以利用 AI 一键剪辑的 「剪小映」,可以理解为剪映的 「傻瓜版」。
另一款 「小云雀」 则是一款面向短视频创作者、电商营销人员以及普通用户的 AI 视频和图片创作助手,内容创作能力会更强,更专业。
自 2023 年发布文生图 AIGC 工具 「即梦」 以来,剪映曾一度沉寂,而近一个月内突发 3 款 AI 创作工具,作为字节 AI 战略的重要一环,到底是适时的 「秀肌肉」 还是被对手 「逼急了」?
AI 工具三连发,字节能让普通人有手就会吗?
经过新识研究所的实测,上述几款 AI 工具都有自己的强项和可取之处,但需要改进的问题也不少。
「剪小映」 的功能非常简单,用户手机的本地相册内只需有拍好的照片和视频,就能根据这些素材智能成片,生成的视频可直接导出文件保存在 APP 里,或者一键分享至抖音、小红书、微信等。
创作界面内,虽然是自由选择素材,但至少要选择 3 个以上的素材才能获得理想效果的视频,AI 会对这些图片进行智能分析,制定出最适合的成片思路,包括模板推荐以及视频主题等,如果不合适,也可以自行提供思路。
像用了三张美食照片的 「日常分享」 模板,得到的就是很常规的抖音 vlog 风,配以优美抒情的文字和音乐,每次看到 AI 分析得头头是道,但是成品并没有太惊艳的效果,而且给的方案风格依赖预设模版,成品间不会有太大差异。
若选择的是不同类型的照片或视频,去硬凑成一个视频,剪小映也能实现,我们选取了风景图、艺术照和日常水果,AI 给出的思路就是城市生活多样之美,也算符合要求,但是图片间的关联度越少,生成的主题也会越缺乏逻辑。
不过目前剪小映不支持拍摄功能,仅能处理本地素材,无法修改字幕、配乐、画幅等,无法覆盖用户从拍摄到二次创作的全流程,更像是 「短视频」 速成工具,适合普通小白分享日常生活。
如果说剪小映是入门选手,小云雀就是专业选手。
与传统 AI 工具单一通用输入框不同,「小云雀」 会让用户先选定场景,分为智能成片、数字人视频、AI 设计、AI 背景四个核心功能,防止生成内容偏离需求。
整个流程分为 「创作想法-理解分析-创意脚本-剪辑成片」 四个步骤,可以直接输入提示词,设置相应参数,让小云雀 AI 自己匹配素材,也可以上传本地图片素材,根据你的图片和提示词要求生成。
期间会放出 AI 的思考和决策过程,提供 4 个相关的方案,用户可以在任意环节进行修改,也可以直达最后产出阶段。
产出的海报风格统一,文案生动,视觉效果专业,比较适配电商素材和 vlog 视频,完全可以直接用于商业推广。
其中最具创设性当然是 「数字人 AI」,不仅可以用真人素材,也可以完全由 AI 生成。我们以 「面霜广告」 为主题,要 AI 生产一段推广视频,最终得到一段有情绪起伏、前后反差、直击用户痛点的 16 面视频,数字人表情自然,语音清晰,内容条理分明,个别片段真有些 「以假乱真」。
不过它也存在明显的缺点,有时候视频中的文字会乱码,生成的字幕风格比较像营销号,水印也不太好去除,还会生成一些不符合客观事实的物体和人物,加上提示词有字数限制,想详细描述场景时比较难。
总的来说,「小云雀」 在商业侧强调决策效率,让创作者能够快速将创意转化为成品,在体验侧追求简洁直观,降低了技术门槛,对于电商和视频的从业者提供了一个十分高效的创作工具。
而 「扣子空间」 更是十项全能,不管是制作 PPT、视频、音频、写代码、生成网页 APP 都信手拈来,目前分成了探索、规划和自由三种模式,探索模式更偏向信息整理,规划模式更偏向执行任务,自由模式则是交给 AI 自己去判断用户需求。
且扣子的内容创作并不是死板的提取信息,它还会自己进行理解并把晦涩难懂的信息用更生动的方式表达出来,提供下载和分享链接。
除此之外,扣子也支持 MCP 协议,并接入了 GitHub、MySQL 数据库、云文档、天气、地图等一系列 MCP 应用,进一步简化大模型调用外部服务的流程。
尽管扣子空间降低了操作门槛,但要准确地定义任务需求,依然考验着用户的 AI 水平,需要投入足够的时间去熟悉和掌握各项功能与使用技巧,才能真正将其潜力充分发挥出来。
可以看出,字节的 AI 工具从面向个人日常到商用设计都有涉猎,争取做到 「有手便行」 的傻瓜式操作,对于 C 端用户的争夺可以说势在必得。
字节 AI 战线收缩,好钢用在刀刃上
浙商证券一份报告指出,2024 年字节 AI 资本开支达 800 亿元,接近百度、阿里、腾讯三家总和,其 2025 年预算再翻倍至 1600 亿元,其中 900 亿用于 GPU 采购。这一投入强度远超国内同行,甚至超过不少欧美科技巨头年度 AI 预算。
AI 助手类产品,是当下竞争最激烈,也最能体现基础大模型能力的赛道,国内主要产品有豆包、DeepSeek、元宝、Kimi 等产品,海外有 ChatGPT、Google Gemini 等产品。AI 产品榜数据显示,今年 4 月份,豆包 APP 月活 1.07 亿,位列国内同类产品第二,DeepSeek、腾讯元宝紧随其后,月活分别为 9688 万和 4143 万。
字节跳动一直以来奉行 「饱和式覆盖」 的策略,在 AI 领域推出了众多产品,涉及聊天机器人、AI 搜索、AI 浏览器、Agent 平台、AI 陪伴社交、AI 教育等大部分主流应用方向,但尚未在单一产品方向上形成碾压性优势。
其 AI 社交产品 「猫箱」 与同类产品 「星野」 之间难分伯仲,AI 视频产品 「即梦」 与快手旗下 「可灵」 在内容创作和商业生态上走向分野,即便是用户数据表现最突出的 「豆包」,也被 DeepSeek、腾讯元宝、KIMI 几大强敌环绕,时不时日活被其他竞品超越。
因此,字节开始整合旗下 AI 部门,提高资源利用率,助其找到 AI 战略的突破口。
今年 2 月份,原 Google DeepMind 副总裁吴永辉入职字节,成为 Seed 基础研究负责人,后面字节 AI Lab 全部收归 Seed 团队之下,Seed 大语言模型 (LLM) 之下的三个团队 Pre-train(预训练)、Post-train(后训练) 和 Horizon 也转为直接向吴永辉汇报。
其后对 Flow 部门旗下产品进行了资源整合,无论是人员变动、战略重心转移,还是内部的精简流程、聚焦主线,字节都在加速向一个以模型为核心、以组织能力为支点的转型方向迈进。
字节此前的综合产品体系,虽然凭借自身技术储备在规模上迅速扩张,但始终无法在细分赛道建立绝对优势,反而容易导致内部资源的分散。于是将自身有限资源聚焦,专注提升基础模型能力,并向豆包、即梦这类表现优异的产品倾斜,是当下字节 AI 发展的策略,这也有助于其找到 AI 战略的突破口。
随着字节 AI 在视觉生成产品上的突飞猛进,高喊要 All in AI 的快手恐成最大输家。
长期以来,快手希望可灵扮演 「破壁人」 的角色,通过技术和产品在专业领域的应用示范,吸引并激发 PUGC 和 UGC 创作者加入 AI 生产、消费与互动,实现快手内容生态和商业化场景的维度拓展。
不过从结果来看成效不明,今年一季度,快手线上营销服务的收入为 180 亿元,同比增幅仅为 8%,平均日活与月活用户数分别为 4.08 亿和 7.12 亿,同比增速分别为 3.6% 和 2.1%,虽有进一步放缓迹象,但依旧高于行业的平均值。
可灵虽为公司贡献营收达到 1.5 亿元,以此计算基本上稳超全年 4.5 亿收入目标,但与头部公司相比杯水车薪,特别是剪映和 CapCut 一年近百亿的总收入。
值得庆幸的是,目前可灵 AI 在推理层面已经实现了边际利润转正。随着业务规模的持续扩大,即便未来进一步增加对推理算力的投入,对集团整体利润的影响也将相对有限。同时随着技术迭代,可灵 AI 推理成本也会进一步走低。
总体而言,「可灵」 目前仍主要依赖 C 端用户作为收入来源,B 端应用尚处于起步阶段。对于视频生成这类尚未大规模落地和普及的 AI 应用来说,「可灵」 当前所取得的发展成果已属难能可贵。
对快手而言,若希望将人工智能技术打造成推动公司增长的新引擎,一方面要实现收入的持续快速增长,另一方面则需在增长过程中保持健康的盈利水平。
目前,「可灵」 在技术和行业布局上展现出一定先发优势,未来如何在业务扩张的同时实现可持续盈利,仍是快手亟需破解的课题。
好在一个视频生成模型,显然是无法满足国内海量用户的创作需求的,无论抖音还是快手,虽然业务处境不同,最终都能寻得自己的一方生态位。