【金猿产品展】Fabarta ArcNeural多模态智能引擎——打造面向AI的数据基础设施,提供支持图、向量和AI推理能力融合...
【数据猿导读】 本产品由Fabarta投递并参与“数据猿年度金猿策划活动——2023中国大数据产业年度创新服务产品榜单/奖项”评选。
Fabarta ArcNeural是Fabarta公司完全自主研发的以 Data-Centric AI 为核心构建的多模态引擎,将传统数据库的“存储&计算”架构演进为 AI-Native 的“记忆&推理”架构,为 AI 应用提供私有记忆和精确可解释的推理。ArcNeural 的宗旨是基于 AI 三要素——数据、算力和模型,为上层 AI 应用提供原生记忆和推理,加速业务智能化创新的进程。
Fabarta ArcNeural 内置了图与向量深度融合的多模引擎,作为私有记忆体的主体结构。它支持将存量数据库(包括 SQL 数据和时序数据等)挂载为外部存储,同时提供统一的多模态数据访问层,用于私有记忆的存取接口。为了便于记忆召回,Fabarta ArcNeural 事先通过内置的专用大语言模型 LLM 自动对原始数据的语义进行推理并建模,形成记忆体中的 Neural Index,有点类似于传统数据库中的 Index。在回忆时,基于这样的 Neural Index,就可以生成 Global Multi-modal Query Plan,快速从不同的存储引擎中找到相关的信息用于进一步的推理,计算或者分析。
例如,在知识库智能问答系统中,首先将企业的数据(原始的 Raw data,如 CRM 、ERP 数据、产品手册等)全部导入 ArcNeural,引擎将自动建模并生成符号化数据(Embedding&Graphing)。当用户提问时,ArcNeural 通过可解释的符号计算(图计算)和向量计算等分析问题、寻找相关高价值数据,并提供优化的运行时环境支撑大模型进行内容生成、归纳和总结。这样既保证了回答的准确性、实时性和私密性,又有效避免大模型的“胡说八道”,为用户提供智能友好的服务。同时,灵活可扩展的引擎架构也同时支撑独立的图数据库、图计算和企业级向量数据库的场景应用,灵活应对企业在业务智能化方面对基础设施的需求。
2023年重大更新升级
1、性能优化和扩展能力:持续改进性能和扩展能力是重点。这可能包括优化查询处理时间、提升数据存取速度,以及改进系统在处理大规模数据集时的横向和纵向扩展能力。
2、改进的多模态能力:提高对多种数据类型(如表格Table、图Graph、时序Temporal、向量Vector和JSON 数据)的支持,可能包括更好的索引策略、更有效的数据存储格式,以及更丰富的查询功能。
3、国产化和运维自动化升级:随着项目的增多,加强自动化部署和管理功能,以及与国产化生态更好的集成。
4、单机分布式一体化设计的增强:优化单机和分布式运行模式的无缝切换能力,使得用户可以更灵活地根据业务需求和资源限制,在单机和分布式模式之间切换,而无需进行复杂的配置修改。同时,这种一体化设计还可以在单机模式下模拟分布式环境,以便于开发和测试。
5、更丰富更高级的查询语句的扩展支持:增加对复杂查询语句的支持,例如支持LDBC测试中的更复杂的子查询、窗口函数、图模式匹配和递归查询等。这将使得用户能够更灵活地查询和分析图数据,特别是在涉及复杂关系和模式识别的应用场景中。
应用场景/人群
多模态智能引擎可以支撑多个场景:
• 贷后风险分析:利用贷款发放后对借款人交易情况进行分析,以降低贷款违约风险。
• 银行交易反欺诈、信用卡申请反欺诈:通过交易链路和关系发现欺诈风险。
• 市场交易风险分析:通过多模态数据分析市场交易风险。
• 智能营销:通过关系等各种维度进行客户分群,给出智能营销推荐。
• 智能运维:通过解析多种数据源自动分析运维数据,发现配置风险。
• 数据血缘:利用图和智能解析进行数据血缘的构建和展示,挖掘孤立节点,节省存储资源。
• 基于本地知识库的智能问答:通过本地知识库结合向量数据库和图结构,结合大模型进行智能问答。
• 企业多模态知识库:通过多模态智能引擎来存储和分析多模态数据,构建多模态知识库。
• 智能合规场景:结合合规文档,结合文档之间的关系和文档相似度,利用多模态智能引擎和大模型进行智能合规问答。
产品功能
ArcNeural 多模态智能引擎是一款创新型的多模态智能应用平台,它将图、向量与AI推理能力深度融合,为用户提供更加智能化、高效化的数据处理和分析能力。这种融合不仅增强了数据的表达能力和处理效率,还为多模态智能应用提供了更丰富的信息和更深入的理解。
其中,ArcGraph 是 ArcNeural 中的图引擎,是公司自主设计和研发的一款分布式、云原生的高性能图 HTAP 数据库,是一款同时支持图查询和图分析的存查分析一体化的融合型图引擎。
• 存、算、分析一体化设计,采用 HTAP 理念,实现在线查询与图计算分析的融合。
• 单机分布式一体化内核架构设计,既可以敏捷部署,又具备强大的性能和横向扩展能力。
• 实现计算与存储的分离,并遵循“Log as Database”的设计理念,解耦计算和存储。
除了 ArcGraph,ArcNeural 多模态智能引擎还包含 ArcVector,这是公司自主设计和研发的一款向量引擎。ArcVector 具有高效存储和检索大规模向量数据的能力。它支持近似检索和索引功能,为用户提供了高效的数据查询能力。这种近似检索功能适用于一些对精度要求不高的场景,而索引则可以大大提高数据查询的速度,适用于对大量数据进行快速检索和分析的场景。
ArcNeural 多模态智能引擎典型功能如下:
• 简洁高效的查询语言
支持 DDL(数据定义语言)、DML(数据操作语言)和 Cypher 查询,为用户提供了丰富的数据操作和查询功能。其中,DDL 用于定义和管理图和向量的数据结构,DML 用于对数据进行增、删、改、查等操作,而 Cypher 查询则是一种简洁、高效的图查询语言,适用于对图数据进行复杂查询和分析。
• 多种数据存储类型
支持表格、JSON、时序 Temporal 等多模态存储,满足用户多样化的数据存储需求。表格适用于结构化数据的存储,JSON 则适用于半结构化数据的存储,而时序 Temporal 则适用于时间序列数据的存储。这些多模态存储方式可以满足用户在不同场景下的数据存储需求。
• 分布式架构设计
支持分布式事务、分布式查询、分布式存储和分布式图计算等功能,为用户提供了高效、可扩展的数据处理能力。通过分布式技术,我们可以将数据分散到多个节点上进行处理,提高数据处理速度和效率。同时,我们也提供了分布式事务和分布式图计算功能,为用户提供了更强大的数据处理和分析能力。
• 数据安全
在数据安全方面,ArcNeural 非常注重数据安全保护,为用户提供了数据脱敏和数据密码等级校验等功能。数据脱敏可以将敏感数据进行脱敏处理,保护用户隐私;而数据密码等级校验则可以确保数据的机密性和完整性,提高数据的安全性。
• 国产化适配与生态兼容性
支持常见的国产操作系统,并与常见国产 ARM 和 X86 芯片兼容,符合国家信息安全战略要求,推动国产化技术的研发和应用。
• 高维向量的检索能力
ArcVector 支持近似检索和索引功能,为用户提供了高效的数据查询能力。近似检索允许用户对向量进行近似匹配,适用于 RAG 等大模型应用场景。索引则可以大大提高数据查询的速度,适用于对大量数据进行快速检索和分析的场景。
产品优势
Fabarta ArcNeural 拥有诸多卓越特性,以适应不断变化的市场需求和复杂的业务场景。其主要优势如下。
• 云原⽣架构
采⽤云原⽣设计,充分利⽤了云计算的弹性和可扩展性,为您的应⽤程序提供了⼀个⾼度可靠且⾼效的基础设施。
• 分布式架构
⽀持分布式架构,可以轻松地扩展到⼤规模的数据处理和计算,以满⾜业务增⻓的需求。
• 内存引擎
ArcNeural 引⼊了⾼效的内存引擎,可以快速处理和分析⼤量数据,以提⾼业务响应速度和决策效率。
• 智能优化器
ArcNeural 使⽤的优化器可以⾃动优化查询性能,通过智能的执⾏计划⽣成,确保能在最短的时间内返回准确的查询结果。
• ⾼可靠性
具有⾼度的可靠性,通过数据冗余和故障转移技术,确保数据在任何情况下都能得到保护和备份。
• 灵活计算
⽀持多种计算模型,从图算法到复杂分析,为业务提供最⼤的灵活性。
• 强⼤的算⼦
具有⼀系列强⼤的算⼦,⽀持 60+ 算⼦、计算表达式、集合表达式、逻辑表达式,以及扩展 Cypher 语法,可以满⾜各种业务需求。
• Semi Stateful
采⽤ Log as database 设计架构,具有⾼性能 WAL 本地写⼊,解耦底层存储复杂度和单机部署能⼒。
• 国产化⽀持
国产化,⽀持常⻅的国产操作系统。
服务客户/使用人数
Fabarta ArcNeural 多模态智能引擎 —— 打造面向 AI 的数据基础设施,提供支持图、向量和 AI 推理能力融合。
已经在多家头部客户进行使用并且获得广泛认可:
包括某股份制银行、常熟农商、蔷薇大树、某头部制造业企业、某大型汽车制造商、某证券公司等。
市场价值
1、高效的数据处理能力:凭借其存储、计算和分析的一体化设计,ArcNeural 能够高效地处理大规模图数据。这对于需要处理复杂关系数据的企业来说,如社交网络、推荐系统、知识图谱和欺诈检测等,具有重要的商业价值。
2、支持复杂查询与高级分析:ArcNeural 的强大查询引擎和计算引擎支持复杂的图查询和图计算分析,使企业能够深入挖掘数据中的潜在价值,从而更好地理解客户行为、市场趋势和内部运营效率。
3、提升决策质量和速度:通过快速、准确的数据分析和洞察,ArcNeural 帮助企业做出更加数据驱动的决策。对于快速变化的市场环境,这种能力是至关重要的。
4、助力数字转型和创新:ArcNeural 的多模态能力,如支持向量、JSON 和图的深度融合,为企业在产品和服务创新方面提供了新的可能性,特别是在人工智能和机器学习的应用领域。
5、提升数据安全和合规性:随着数据安全和隐私法规的日益严格,ArcNeural 提供的加强安全性和合规性功能帮助企业更好地遵守法规要求,减少合规风险。
6、总体拥有成本(TCO)的优化:通过提供高性能的解决方案,并结合云原生架构和灵活的部署选项,ArcNeural 可以帮助企业在满足其技术需求的同时,优化总体拥有成本。
产品所属企业·:Fabarta
Fabarta 成立于 2021 年,是一家 AI 基础设施公司,提供“一体两翼”的产品矩阵,通过探索和联结数据资源,助力企业实现智能驱动的持续创新。在引擎层,打造面向 AI 的数据基础设施,提供支持图、向量和 AI 推理能力融合的 ArcNeural 多模态智能引擎;在平台层,通过 ArcPilot 企业智能分析平台加速可解释图智能和新一代 AI 技术在企业场景的落地,同时利用 ArcFabric 多模态数据编织平台帮助企业梳理多模态的数据资产,让企业充分发挥数据流动带来的价值;此外,Fabarta 可以基于多模态智能引擎、企业智能分析平台和多模态数据编织平台与客户和伙伴一同构建行业应用,加速企业数智化转型和 AI 技术的落地。
来源:数据猿