܄

业内首个数据治理大模型问世!百分点科技定义AI原生治理新标准

【数据猿导读】 11月16日,在“2025第四届数据治理年会”上,百分点科技正式发布百思数据治理大模型(BS-LM)与百思数据治理平台(AI-DG)。

业内首个数据治理大模型问世!百分点科技定义AI原生治理新标准

“领域大模型+AI原生平台,开启AI治理新时代。

在AI技术重塑各行各业的当下,高质量数据已成为企业挖掘业务价值的核心引擎,不仅能驱动精准决策,激活创新场景,而且能为业务增长注入持续动力,成为政企在竞争中突围的关键。

然而,AI时代对数据质量、效率的高要求,也让传统数据治理模式陷入瓶颈:依赖专家经验的流程效率低、成本高,流程繁琐,难以适配快速变化的业务需求,数据治理如何更好交付成为行业亟待破解的难题。

作为深耕数据治理领域十年的先行者,百分点科技有底气重塑数据治理这一流程:自2015年推出首款大数据治理平台以来,服务了30个行业近千个项目,产品不断迭代升级,更沉淀出专业服务团队,在行业覆盖、业务深度、产品完善度上均树立行业标杆。

11月16日,在“2025第四届数据治理年会”上,百分点科技正式发布百思数据治理大模型(BS-LM)与百思数据治理平台(AI-DG)。作为业内首个数据治理垂直大模型,百分点以“智能决策+高效执行”双引擎,实现了数据治理从顶层设计到数据应用的全链路自动化,标志着数据治理从“专家驱动”迈入大模型引领的“智能自治”新纪元,为政企打造可信数据资产提供新范式。

数据治理的三次进化:

从人工辅助到AI原生

百分点科技政企事业部总经理马伟凯在主题演讲中回顾数据治理生态的发展历程,其核心模式随技术迭代与需求升级不断进化,可清晰划分为三个关键阶段,每个阶段均对应着不同的治理逻辑与实践形态。

1.0时代:人工+平台,以流程制度为核心。

数据治理1.0时代的核心是“标准化平台+专家经验+全流程服务团队”的组合,聚焦通过工具与人力协作完成基础数据治理任务。

这一阶段,行业竞争与甲方客户关注的重点集中在两方面:一是平台功能是否完备,能否高效实现数据汇聚、加工处理与BI报表生成;二是服务团队是否具备深厚行业知识,能否依托经验落地治理流程。

而该模式的局限性也十分突出:实施周期长,对团队配置要求高(需涵盖业务专家、技术人员等多角色),且治理价值难以感知——领导层与业务层往往无法清晰看到治理前后的实际差异,数据治理更多停留在“流程合规”层面,未能充分转化为业务价值。

2.0时代:平台+AI,以AI能力嵌入为手段。

随着算法模型技术发展,数据治理迈入2.0时代,核心特征是“AI能力嵌入平台”,通过点状智能突破实现效率提升与成本降低。这一阶段,平台功能的智能化成为核心方向:AI技术的融入显著降低了实施研发门槛,减少了重复人工操作,让数据治理的整体效率得到明显改善。

然而,2.0时代仍未突破核心瓶颈:一方面,平台运转高度依赖行业专家的强支持,缺乏专家参与则难以持续推进;另一方面,AI优化多集中于单点功能如数据清洗、规则匹配等,未形成覆盖治理全流程的体系化方案,无法从根本上重塑治理工作模式。

3.0时代:AI原生治理,以大模型为内核、多智能体为载体。

为解决前两个阶段的痛点,数据治理进入3.0AI原生治理时代,其核心是“大模型+多智能体”的深度协同——以大模型为内核提供专家级知识赋能,以多智能体为载体实现全流程自动化运转。

这一阶段彻底重构了数据治理逻辑:首先,大模型替代传统全流程服务团队,整合业务专家、咨询顾问、数据架构师等角色的专业知识,为治理工作提供统一支撑。

其次,多智能体协同覆盖治理全链路,从业务需求分析、数据接入,到数据加工、治理落地,实现“从0到1”构建数据治理平台的全流程自动化。

最后,治理模式从“人工主导”转向“AI自主决策与执行”,不仅大幅降低人力依赖,而且更能让治理价值快速传递至业务端,真正实现数据治理与业务需求的深度融合。

百思大模型:

双引擎开启数据治理智能自治新范式

为破解传统数据治理依赖专家、效率低、价值难感知等痛点,百分点科技推出了百思数据治理大模型(BS-LM),作为数据治理的“智能决策引擎”,其以“知识+推理”模式重塑数据治理全流程。其中,知识层面依托深度行业积淀提供专家级知识赋能,推理层面通过自然语言驱动与多智能体协同,将治理工作快速落地,二者结合让数据治理从“人力密集”转向“智能自治”,更高效地为业务方呈现数据报表与价值,带领行业进入数据治理3.0时代。

数据治理_大模型_百分点科技-1

马伟凯介绍说,百思大模型的核心能力集中在4大方向,精准匹配数据治理全场景需求。

其一,具备深度语义解析与多步骤逻辑推理能力,可实时响应复杂治理问题,提供规则解读、标准对照与最佳实践推荐,实现专家知识的系统化传承与普惠化应用。例如专家级业务知识理解,可精准区分不同行业术语内涵,如“三防”在消费电子领域指“防尘、防水、防摔”,在应急领域则是“防汛、防旱、防台”,避免通用模型的知识偏差,确保治理贴合真实业务场景。

其二,全流程规划与智能编排,覆盖从数据集成、资产分类到指标体系搭建的开发全链路,无需人工拆分环节,实现端到端治理支撑。

其三,数据治理资产自动生成与标准化管理,实现数据模型设计、质量规则配置、资产目录构建等关键工作的自动化,推动治理模式从“项目交付”向“资产运营”转型升级,既能响应国家政策要求,识别并加工高质量数据集,又能自动生成标准化数据治理资产,降低人工标准化成本。

其四,治理成效与价值度量,可基于治理内容自主评估效果,还能测算高质量数据集的业务价值,动态追踪关键价值指标,精准回答“治理是否有效”的核心问题,让治理成果与价值可视化,助力企业实现从数据资产沉淀到业务价值提升的跨越。

百思大模型的独特优势,源于百分点科技10年数据治理服务的沉淀与创新训练方式。

在语料层面,百分点科技将10年项目经验中的核心知识系统化沉淀。项目结项时,业务系统、数据主题库、数据源标准、行业政策文件、企业指标体系等元数据与公开信息,需按流程回流至公司,且不涉及客户隐私,为大模型提供了行业适配性极强的语料基础。

在训练方式上,针对数据治理不同流程的能力需求差异,先为各领域训练专属模型,再通过知识融合对齐语义、整合能力,有效规避了单一模型易出现的知识遗忘、交叉干扰问题,让大模型在各治理场景中均能精准发力。

从实际应用场景看,百思大模型的价值更具象:数据标准场景中,可从多模态文件快速提取国标、行标知识并按格式沉淀,还能自动完成“逻辑模型转物理模型”“数据标准落地校验”。

数据仓库模型规划场景中,以应急领域为例,可自主输出分层架构、主题专题及核心实体,还能诊断现有模型的实体缺失、属性不足等问题,并给出优化建议,真正让数据治理实现“少专家依赖、高效率落地、高价值呈现”。

百思数据治理平台:数据治理的高效执行引擎,让落地更简单

在百思数据治理大模型提供专家级知识赋能后,数据治理的落地执行仍需高效载体。百分点科技推出的百思数据治理平台(AI-DG),正是以“高效执行引擎”的定位,承接大模型的指导成果,解决数据治理开发落地中的核心痛点,实现从“知识指导”到“实际落地”的闭环。

数据治理_大模型_百分点科技-2

AI-DG平台是以大模型为内核、以多智能体协作为载体、以AI自主工程化交付为目标的下一代数据治理平台。其核心聚焦三大问题,打破传统数据治理开发的低效困境。

其一,需求拆解与自动执行难题。平台可自主拆解业务需求,明确需开展的工作项,再通过多智能体协同自动推进,无需人工逐环节规划。

其二,操作界面复杂问题。摒弃传统平台“顶部一级功能+左侧二级功能”的繁琐设计(成熟平台常含数十上百个功能,用户难以快速上手),采用自然语言对话引导式界面,降低操作门槛。

其三,全流程覆盖不足问题。从业务需求分析,到数据接入、加工、治理,再到最终成果呈现,平台实现全链路支撑,无需依赖多工具切换。

跟据客户现场实践数据,AI-DG平台可将实施周期缩短70%以上,运营成本降低超50%。

从实际应用场景来看,AI-DG平台适配不同客户基础,展现出极强的落地能力。针对“未建数据中台/治理平台”的客户,平台以交互式方式引导项目规划落地:先基于调研模板梳理需求,自动生成数据接入任务;数据接入后,联动大模型能力沉淀数据标准、设计数据仓库方案(明确库表结构),用户可修正推荐规则,修正内容回传平台后,自动生成数据处理逻辑;后续还能按行业特性推荐企业指标运营体系,确认后自动加工指标,最终通过智能报告或问数产品实现数据查询。

针对“已建数据中台”的客户,平台可快速响应临时需求。以零售行业“商品补货”场景为例,平台能自主分析现有数据是否支撑需求,若数据不足则定位需补充数据的系统、判断是否纳入主题库,最终形成专题分析,直接回答“某门店是否需要补货”;类似地,月度运营分析报告也可基于平台数据自动生成,无需人工反复提取加工。

AI-DG平台的高效执行能力,源于两大核心支撑。一方面,平台内置涵盖数据接入、标准制定、加工处理等各环节的专属智能体,这些智能体脱胎于百分点科技10年数据治理项目沉淀的成熟实施方法论,可精准匹配治理全流程需求。

另一方面,平台具备“方案自动规划”能力,能基于业务主题分析需求、调用对应智能体,同时还支持数据安全与运维工作,通过智能体自动完成后期运营,真正实现数据治理“从需求到落地,再到运维”的全周期高效运转。

领域大模型+AI原生平台

开启AI治理新时代

当数据治理迈入AI时代,“领域大模型+AI原生平台”的组合正成为破局关键。百分点科技发布的百思数据治理大模型(BS-LM)与百思数据治理平台(AI-DG),以协同之力重塑治理全流程,真正开启AI治理新纪元。

数据治理_大模型_百分点科技-3

百思大模型聚焦“专家级知识赋能”,凭借10年行业语料沉淀与分领域训练优势,实现业务知识精准理解、治理全流程规划、数据资产自动生成与价值度量,为治理工作提供专业指导。

AI-DG则承担“高效执行引擎”角色,以友好化开发界面、自主化规划能力、多智能体协同功能,通过自然语言交互降低操作门槛,让治理落地更高效。

二者联动还支撑了百思智能应用,精准解决“数据价值最后一公里”难题,推动业务人员与领导深度参与开发。例如在广州白云应急领域,智能治理方案在智能预案拆解方面已获得能力印证,实现从“被动响应”到“主动服务”的跨越,让Data for AI的推进更顺畅。

展望未来,马伟凯认为,AI数据治理的演进路径清晰可见,4大趋势将重塑行业格局:

其一,智能体从“预置”走向“自主演化”,未来可根据需求自动创建、管理与迭代,摆脱对人工配置的依赖;

其二,实体自治能力持续加强,data fabric、data match等技术成熟后,无需再通过集中式治理归集所有数据,大幅降低治理成本;

其三,垂直领域大模型加速普及,随着治理自治能力提升,各行业对适配自身需求的垂类大模型需求激增,推动领域化治理深化;

其四,知识联盟生态加速形成,治理生态将从“数据知识互联互通”,拓展至“行业知识互通”,促进跨主体、跨领域的知识协同。

这一系列变革,正让AI治理从“效率提升”走向“价值重构”,为政企数据资产化与业务智能化注入持久动力。

正如百分点科技CEO苏萌所言,“未来的AI竞争中,比参数规模更重要的是场景深度。百思大模型的意义,不仅在于技术突破,更在于它把10年沉淀的治理方法论‘产品化’,进而赋能行业和客户完成高质量、高效率、高价值的数据治理。”


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

百度文心大模型5.0发布;腾讯混元图像3.0上线LiblibAI | 每日大事件
百度文心大模型5.0发布;腾讯混元图像3.0上线LiblibAI | ...
腾讯发布甲骨文智能体;智源发布多模态世界大模型悟界·Emu3.5,可实现跨场景具身操作 | 每日大事件
腾讯发布甲骨文智能体;智源发布多模态世界大模型悟界·Emu3....
全球首款类脑智算体智者一号亮相;百度联合上体发布“上体体育大模型2.0”;钉钉发布矿业AI解决方案 | 每日大事件
全球首款类脑智算体智者一号亮相;百度联合上体发布“上体体育...

我要评论

数据猿微信公众号
第22届国际物联网展
返回顶部