文 | 港股研究社
「属于传统搜索的时代,已经彻底落幕了。」
2024 年 2 月,全球 IT 分析与评估机构 Gartner 在一份报告中如此判断。同时该机构预测,到 2026 年,传统搜索引擎的搜索量将减少 25%。
与此同时,从最近公布的财报来看,2024 年 Q2,百度的在线营销收入为 192 亿元,同比降低 2%。这是连续 6 个季度以来,在互联网广告大盘保持增长的情况下,百度在线营销收入首次陷入下滑。
作为曾经国内广告收入最高的互联网公司,百度早已不复昔日辉煌,但最近一则消息还是引发了市场对这家公司的重新关注。8 月 22 日,百度百科开始屏蔽谷歌/必应等大多数搜索引擎的抓取,阻止他们利用百度百科内的内容用于训练 AI。
面临营收的下滑,百度禁用其他搜索引擎对百度内容的抓取,意欲何为?AI 搜索能够拯救百度吗?面对抖音、小红书等垂直搜索的竞争,传统搜索巨头未来的路在何方?
内容平台与搜索引擎的 「版权之争」,由 AI 挑起
2024 年 3 月,谷歌因违规使用出版商内容训练大模型 Gemini,被法国政府处以 2.5 亿欧元的罚款。7 月 23 日,AI 搜索引擎 Perplexity 被杂志巨头康泰纳仕集团告上法庭。类似的冲突同样发生在中国,8 月 16 日,知网发函警告 AI 搜索初创公司秘塔科技,称其未经许可在 AI 搜索结果中呈现知网的学术内容,构成严重侵权。
细看以上因为 AI 搜索带来的纠纷,搜索引擎与内容平台之间的冲突存在着共性的问题:
1. 内容平台只有内容的传播权,没有所有权。
无论是文章还是视频,版权都属于原创作者,平台只有传播权。因此,如果 AI 搜索公司使用了相关内容进行 AI 训练,应当由内容作者亲自维权,而不是平台。此前 《纽约时报》 起诉 OpenAI 就是最好的例子。
2. 以索引库的形式进行整合,构成侵权。
目前的 AI 搜索大多会将从内容平台抓取的内容以索引库的形式进行储存。当用户搜索时,再利用 AI 技术将实时结果和索引库内容整合在一起提供答案。这种提前储存的方式,侵犯了内容平台的信息网络传播权。
3. 技术原因导致过拟合问题,构成侵权。
在少部分情况下,AI 模型会因为训练技术问题出现过拟合问题,导致输出的结果内容和训练内容高度相似,而这种照搬、「洗稿」 的行为,实质上是从对 AI 对网站内容的合理使用变成了抄袭,同样侵权。
从这三点出发,再回看百度这件事。百度百科作为一个百科全书形式的内容平台,既拥有部分百科词条的版权所有权,也拥有相关内容的传播权。因此,百度百科禁止谷歌、必应等引擎的抓取,既存在版权保护方面的合理性,也不失为 AI 搜索时代的一种 「自我保护」。
事实上,长期以来,内容平台的利益与搜索引擎都是深度绑定的,搜索引擎平台带来流量入口,内容平台提供优质内容的同时通过广告等方式盈利,已经成为某种 「默契」。然而,随着 AI 的兴起,新产业的出现打破了旧的秩序。用户获取信息的来源从网站链接变为了 AI 引擎,内容网站的利益受到了影响,因此才会产生矛盾与纠纷。
搜索行业 「改朝换代」 的背后,AI 搜索如何拯救百度?
谷歌 CEO 桑达尔·皮查伊曾表示,「搜索引擎的目的从来都不是搜索,而是提供优质内容。」AI 搜索则恰好捕捉到了这个痛点:传统搜索有着较长的信息获取链路,而 AI 则代替人脑,省去了用户在不同网站之间跳转、分辨和总结的时间。
同样的关键词,AI 搜索可以将视频、图片、文字、语音等多样化的内容呈现在观众面前,而不再单一地局限于网站这一种形式,搜索结果更准确。此外,AI 搜索在广告内容的呈现上也能给用户带去更好的体验。传统搜索引擎中的竞价排名严重影响了有效信息的密度,进而影响到用户的搜索体验。
正是由于以上优点,AI 搜索正在逐渐占据传统搜索的市场份额。中信证券研报显示,2024 年 3 月 AI 产品的访问量中,AI 搜索占比达 24.2%,成为第二大使用场景。从这个角度来看,在不远的将来,AI 搜索代替传统搜索会是大势所趋。
事实上,百度在限制其他搜索引擎对百度百科的内容进行抓取的同时,自身也在不断地加大对 AI 搜索的投入。目前百度的文心大模型日均调用量超 6 亿次,二季度百度搜索中已有 18% 的结果由 AI 生成。
然而,百度 AI 对搜索的影响仍处在早期阶段,「短时间内不仅难以展现出对业绩的提升,甚至可能对收入产生负面影响。」 放眼整个行业,除了百度以外,其他人都在加快自己的步伐。
在国际市场有谷歌、微软、OpenAI、Perplexity。在国内市场,不仅有 360AI、秘塔 AI 和天工 AI 三大搜索引擎,还有 Kimi、文心一言、豆包等内嵌 AI 搜索功能的聊天类模型产品。
不难看出,在这一轮 AI 重构搜索的行业热潮中,在谷歌、微软、百度等科技巨头以外,还出现了许多的大模型企业。这就意味着在原有的谷歌、必应、百度之外,行业内又多出了许多 「搅局者」。百度当前的压力可想而知。
搜索迎来 「终局之战」,百度不能再慢了
从用户的角度来讲,AI 搜索的确存在市场需求,也确实能够改善现有的搜索体验,但是无论是 AI 搜索还是传统搜索引擎,本质上都是通用搜索,而通用搜索本身正在弱化。
而根据国外数据机构 statcounter 数据,在 PC 端,百度的渗透率在最近的一年内出现了下滑。此前,百度已不再是中国第一大桌面搜索引擎 这一消息就曾登上热搜。
与之相对的,是抖音,小红书,知乎一类的内容平台对搜索的布局。
2020 年年初,字节跳动推出头条搜索,用 「搜索+信息流」 的内容模式直接对标百度。此后三年间,字节跳动陆续推出了悟空搜索和闪电搜索,2024 年 8 月,抖音搜索独立 App 上线,使用基于抖音打造的内容搜索引擎,成为字节旗下第 4 个独立的搜索应用。
此消彼长的原因,主要是公域的内容质量出现了下降,优质的内容逐渐被抖音,小红书,知乎等内容 App 分走。用秘塔 AI 首席运营官王益为的话说,「衣食住行、买点什么,这些优质数据小红书和抖音并不会向外公开,而且都是大家主动贡献上去的,我们拿不到,传统搜索引擎也拿不到。」
以视频大模型为例,此前,快手和 OpenAI 都发布了视频大模型。如今,快手已有超过 160 万人使用过快手的视频生成大模型可灵 AI,累计生成超 1600 万条视频,而 OpenAI 的 Sora 至今还没有公布下一步的进展,也没有实现规模化的应用。在这背后,快手拥有海量的短视频内容,可以说是居功至伟。
从这个角度来看,AI 搜索真正的对手早已不再是传统搜索,而是垂直搜索。传统搜索引擎公司的对手也并非 AI 初创公司,而是抖音、小红书之类的内容厂商。
对于谷歌、百度这样的传统巨头来说,如何利用自己的 AI 优势和垂直 APP 的内容优势去竞争,会是下一个阶段需要重点考虑的问题。哪些场景是有了 AI 才可能做到的?哪些功能更能够满足用户的需求?这就考验各大科技巨头们产品经理的能力了。