StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来
数据猿 | 2025-09-16 13:26
【数据猿导读】 9 月 13 日, StarRocks Connect 2025 于线上线下同步举行并圆满落幕。作为 StarRocks 全球峰会在中国本土的延伸,本次活动以“连接”为核心主题,吸引了数万名开发者与行业专家参与。活动汇聚了来自携程、Shopee、Cisco、SJM Resorts 等全球知名企业的一线技术领袖,共同分...

9 月 13 日, StarRocks Connect 2025 于线上线下同步举行并圆满落幕。作为 StarRocks 全球峰会在中国本土的延伸,本次活动以“连接”为核心主题,吸引了数万名开发者与行业专家参与。活动汇聚了来自携程、Shopee、Cisco、SJM Resorts 等全球知名企业的一线技术领袖,共同分享了 StarRocks 在复杂业务场景下的前沿实践,并深度探讨了数据分析技术的未来演进方向。
技术演进:从性能引擎到 AI Native 平台
StarRocks TSC Member、镜舟科技 CTO 张友东以《StarRocks: Connect Data Analytics with the World》为主题,分享了 StarRocks 从“过去、现在、未来”三个维度的发展进程。
1. 连接世界(过去)
历经五年发展,StarRocks 已成为一个拥有超 11,000 GitHub Stars、500 余位代码贡献者和全球数万名社区用户的顶级开源项目,用户版图横跨亚、美、欧,覆盖了从 Shopee、Grab 到 Microsoft、Pinterest 等超过 500 家行业领导企业。
2. 连接现代数据分析(现在)
面对从传统 BI 向运营分析(Operational Analytics)演进带来的实时、高并发挑战,StarRocks 凭借其统一湖仓引擎,有效解决了“烟囱式”架构的弊病。
StarRocks 的性能持续精进,TPC-DS 测试成绩从 2.0、3.0 到即将发布的 4.0 版本一路提升。同时,针对半结构化数据的核心功能 FlatJSON 也在 4.0 中迎来了 V2 版本的重大优化,性能提升超 10 倍。
通过在存算分离架构下实现极致性价比的实时分析、强大的查询性能以及接近原生表性能的数据湖分析能力(性能达 Trino 的 3-5 倍),StarRocks 已成功支撑 Pinterest 广告平台、Fanatics 体育平台、淘宝闪购等复杂业务,实现了高达 90%的成本节约。
3. 连接 AI Agent(未来)
张友东首次分享了将于 10 月发布的 StarRocks 4.0 在 AI Agent 辅助数据建模方面的探索。
通过创新的 Multi-Agent 协作框架,AI 能够智能分析用户输入,自动推荐最优建表语句,其准确率远超传统大模型。他强调,未来的数据系统必须具备自然语言接口、实时上下文感知、低延迟高并发等特性,才能真正成为“AI Agent Ready”的系统。
演讲最后,张友东宣布:“在 StarRocks 之上构建的 Multi-warehouse 企业级能力将正式开源,希望用开源技术帮助大家创造更大的业务价值。”
商业化视野:从生态构建到市场验证
镜舟科技解决方案架构师石强则从商业化视角,分享了 StarRocks 社区背后的可持续发展模式。
商业进展是最好的市场验证。石强展示了镜舟科技在商业化上取得的切实进展。通过服务在全球拥有复杂业务的头部企业,StarRocks 的能力在处理复杂跨国业务场景以及生产环境中得到了验证。
商业投入驱动企业级能力建设。他强调,许多企业级客户关注的重点,如严格的安全合规(ISO/IEC 27001, SOC 2 Type II 认证)、完善的生态对接(与 Databricks、AWS 等主流平台的官方合作),往往需要商业公司投入大量资源去完成。这些由商业化驱动的投入,极大地提升了 StarRocks 在大型企业中的可信度和部署可行性。
落地实践:一线企业如何利用 StarRocks 解决业务问题
如果说技术演进是“做什么”,那么企业实践则回答了“解决了什么”。现场来自全球的企业用户展示了 StarRocks 在真实生产环境中的卓越表现,覆盖电商、旅游、跨国协作、数据治理等多个核心领域。
Shopee:驱动核心电商业务的实时引擎
作为东南亚电商巨头,Shopee 大数据专家工程师马腾分享 StarRocks 如何应用于其的业务场景,包括广告投放效果的实时监控、收入损失分析平台、百万级卖家健康度指标库以及 ShopeePay 支付与保险等高并发金融业务,以湖仓一体架构从容应对大促挑战,实现了高性能与高可用的完美平衡。
携程:以极致性能支撑业务出海
携程大数据平台开发专家魏宁、携程 IBU Data Engineer 蔡俊卿在分享中提到,通过经典的存算一体与先进的存算分离架构并用,携程高效处理海量订单与用户行为数据。在多个核心场景中,StarRocks 带来了高达 98%-100%的查询性能提升,为携程的全球化业务拓展和超个性化用户体验提供了坚实的数据支撑。
Cisco:跨国巨头内部的性能与成本双优之选
来自 Cisco 团队的白旭与许鸿坤通过详实的数据对比,展示了 StarRocks 在 Webex 业务中的优势。性能上,查询速度平均比 Trino 快 21%-53%;存储上,处理 17.5 亿行数据时,StarRocks 的存储占用仅为 Pinot 的 1/4,成本效益显著。其全面的功能集与完善的权限体系,也成为 Cisco 选择 StarRocks 的关键。
SJM Resorts:现代数据栈赋能智慧旅游
SJM Resorts 企业方案设计高级经理胡翔展示了“dbt + DataOps + StarRocks”组合能力。通过将数据建模、版本控制、自动化测试与部署无缝集成,SJM Resorts 构建了一套高效、可靠的数据治理体系,将数据洞察力注入复杂的旅游休闲服务中,极大提升了决策信息的质量与时效性。
共话数据基础设施的下一站
圆桌讨论环节为当前的 AI 热潮注入了一剂清醒剂,将话题拉回到务实的融合路径上。在白鲸开源 CEO 郭炜的主持下,嘉宾们达成初步共识:“大数据已死”是伪命题。
正如中启乘数科技创始人及 CTO 唐成所言:“大数据并非消亡,而是在 AI 推动下进行架构、技术等方面的演进调整。”
对于未来架构,讨论的结论并非颠覆,而是适配。短期内,数据基础设施的核心任务是增强自身以服务于 AI,例如统一元数据、强化向量搜索能力,并处理好非结构化数据的 ETL 这类“脏活累活”。镜舟科技 CEO 孙文现指出:“大模型直接吞吐所有数据’是美好想象但几乎不可能实现,更现实的是让大模型增强大数据能力。”
回归到人的价值,AI 不会替代优秀的工程师,但会淘汰重复性的工作。正如英飞流联合创始人张颖峰所强调的,“知道做什么(发现问题)”将比“知道怎么做(解决问题)”更重要,这为所有数据从业者指明了价值提升的方向。
从精彩的分享到热烈的问答,再到轻松的社交时光,与会者与 StarRocks 社区一起,带着开放、协作、共赢的开源精神,探索数据分析的无限可能。
来源:数据猿
刷新相关文章
我要评论
不容错过的资讯
大家都在搜
