6 月 27 日消息,今天上午举行的全球人工智能开发与应用大会上,腾讯云大数据基础产品中心总经理程彬透露,腾讯云已经构建完善的“Data+AI” 能力,今年下半年将发布数据智能体产品。
程彬表示,数据作为传统数据平台、AI 大模型平台的共同“ 石油原料”,“Data+AI” 不仅仅是数据的简单叠加,更是深度融合与创新,实现从“ 让数据说话” 到“ 与数据智能对话” 的跃迁。
数据显示,2024 年国内数据生产总量首次突破 40ZB,达到 41.06ZB,同比增长 25%,增速较去年提高 2.56 个百分点;人均数据生产量约为 31.31 太字节 (TB),相当于 1 万多部高清电影,同比增长 25.17%,数据生产总量和人均产量实现同步跃升。
最新发布的 《Data+AI 下一代数智平台建设指南》 报告显示,Gartner 研究表明,非结构化数据占当今组织数据的 70% 至 90%。受生成式 AI 计划、多模态数据处理需求的爆炸式增长以及合规性压力的推动,企业对非结构化数据管理的需求急剧增长。
因此,非结构化数据处理支出在数据管理总支出中所占的份额将越来越大。
随着 AI 大模型对于数据的需求增加,传统数据平台在应对生成式 AI 带来的新型数据需求时,正面临严峻挑战。同时,生成式 AI 应用场景中,数据质量、合规性和安全保障,成为企业面临的核心难题。
一方面,企业面临数据源激增、数据孤岛严重的挑战 (据统计企业平均管理 400+异构数据源);另一方面,企业需打造动态、可追溯的数据治理体系,避免“ 幻觉输出” 与隐私风险。
Gartner 预测,到 2027 年,80% 的数据和分析 (D&A) 治理举措将因缺乏真正或人为的危机而失去作用。同时,专注于多结构化数据管理的 IT 支出将占数据管理技术和服务总 IT 支出的 40%。
腾讯云副总裁、腾讯云大数据产品负责人黄世飞表示,当 AI 的能力唾手可得,企业如何唤醒海量沉睡的非结构化数据,如何跨越组织鸿沟,以及如何确保喂给 AI 的数据高质量,可信赖,规避幻觉与风险,变得至关重要。
程彬指出,传统数据平台在新的发展周期中遭遇瓶颈,从数据挖掘到数据训练的过程中,流程非常复杂,人力成本变高,整个开发周期变得更长。同时,从客体上看,市场已经从以数据工程/科学开发为中心,到以大模型/Agent 为中心;使用方式上,从人找数据,到 Agent 带着问题找数据;平台定位层面,从被动的数据“ 仓库”,到主动的、可供 Agent 实时查询和交互的“ 知识母体”(Knowledge Substrate)。
因此,腾讯云大数据提出“Data+AI” 的深度融合,构建一个为 AI 时代而生的原生一体化的 Data+AI 平台,以数据为基础,以智能为目标,做下一代数智平台,以应对全新的市场和客户需求。
通过集成多模态数据处理、AI 模型、Data Agent 等,腾讯云构建新一代数据智能平台 DIaaS,从而通过“Data+AI” 将非结构化数据被有效利用,让所有数据都能被 AI 进行理解,让数据不仅能存储,更能使用。在腾讯云看来,DIaaS 不是一种工具而是一种能力,让数据智能真正成为触手可及的“ 水、电、煤”。
会后交流时,对于“DataxAI” 和“Data+AI” 的区别,程彬认为,如果用乘 (x),更多是希望这个事情的价值变得更大,但他认为,无论是加法还是乘法,本质上 Data 和 AI 融合的价值未来越来越大。
“ 下一代数智平台的跃迁是不是因为 AI 大模型带来的?确实,我觉得有两个,第一、肯定是大语言模型技术成熟后,进一步让 Data 有更好的发展路径;第二、最本质原因还是需求,如果用户没有这样一个需求,或者需求很小,那么再牛的技术还是没办法产生价值。” 程彬表示。
程彬强调,目前国内没有对标 Snowflake、Databricks 的 AI 大数据创业公司。
他指出,大模型来临之后很多 Database 公司都在快速转型到“Data+AI”,比如 Snowflake、Databricks 等都快速转型成功,到目前 Databricks 估值超过 600 亿美元,Snowflake 市值也达到 740 亿美元,所以看起来它们转型比较成功,但反观国内没有相关有技术实力的大数据初创公司,但未来是很看好的。
“ 我觉得最快下半年有一些新的对标 Snowflake、Databricks 这样的 Data+AI 公司的出现,我们非常欢迎,这个赛道玩的人越多,这里面才有更大的可能,如果光靠我们一个人去做,那么多客户需求不一定全都能满足。” 程彬称,DIaaS 的建设是一个长期而系统的工程,需要行业协同、共同探索。
他预测,随着未来通用人工智能 (AGI) 时代到来,Agent 智能体可能会慢慢消失,被 AI 模型所替代。但 1-3 年内短期看,Agent 可以帮助用户提升数据要素价值。
截至目前,中国数据领域相关企业超 19 万家,数据产业规模超 2 万亿元。按照 20% 以上的年均增长率测算,2030 年中国数据产业规模将达 7.5 万亿元。(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App