܄

【金猿投融展】涛思数据——专注时序大数据的处理

【数据猿导读】 项目由涛思数据投递并参与“数据猿年度金猿策划活动——《2022大数据产业年度创新服务企业》榜单/奖项”评选

【金猿投融展】涛思数据——专注时序大数据的处理

北京涛思数据科技有限公司( TAOS Data ) 瞄准日益增长的物联网数据市场,专注时序空间大数据的存储、查询、分析和计算,不依赖任何开源或第三方软件,开发了拥有自主知识产权、100% 自主可控的高性能、分布式、支持SQL的时序数据库 TDengine。TDengine 可广泛运用于物联网、车联网、工业互联网、IT运维等领域。公司已经申请多项技术发明专利,且全部提交 PCT 专利申请。

2017.6月公司成立,截止2022年公司规模90+。

重要产品及服务能力

涛思数据作为一家高科技企业,针对物联网、工业互联网、金融、IT 运维监控等场景,独立研发了开源、云原生的时序数据库 TDengine,它能让大量设备、数据采集器每天产生的高达 TB 甚至 PB 级的数据得到高效实时的处理,对业务的运行状态进行实时的监测、预警,从大数据中挖掘出商业价值。

金猿投融展_涛思数据_大数据-1

2022 年,云原生时序数据库 TDengine 3.0 正式发布。作为一个云原生,而不只是能在云上运行的时序数据库,TDengine 彻底具备了云原生数据库的几大特点:水平扩展性、弹性、韧性、可观测性以及运维自动化。

金猿投融展_涛思数据_大数据-2

金猿投融展_涛思数据_大数据-3

自 2018 年商业化版本发布后,TDengine 已经在全球 400 多个城市中,被广泛应用在了物联网、工业互联网、IT运维、车联网、能源和金融等各行业,为各企业的数字化改造和转型、效率提升以及存储、运维成本降低上做出很大贡献。

在已发布的70余个Case 文章中,我们可以看到各种传统监控平台的性能症结被解决,数字化、智慧化转型变得更顺畅,一部分案例如下:

① 顺丰科技:根据容量规划完成相关参数调整后,在理想情况下,TDengine 集群写入速度最高达到90w条/s的写入速度。服务端物理机由 21 台降至 3 台,每日所需存储空间为 93G(2副本),同等副本下仅为 OpenTSDB+HBase 的约 1/10。

② 零跑科技:不用再像 MongoDB 一样,在查询前还需要根据业务加工出需求数据,TDengine 的列式存储,直接以 SQL 计算即可,大大提高了业务的灵活性,同时其高压缩算法提升了 10 到 20 倍的压缩性能。

③ 跨越速运:应用TDengine后服务器数量从 21 台降至 3 台,压缩一个 5 万行、每行在 600 字节以上的表,压缩后的磁盘 size 是 1665KB,压缩率高达 1%。

④ 浙商银行:目前微服务可视化服务治理平台对并发要求较高,但是 TDengine 可以很好地满足需求,插入/查询平均耗时均在 10ms 以内。

⑤ 同花顺:在稳定性上,改造前调用数据情况共40W次,共出现异常0.01%的异常,使用TDengine改造后出现异常降低至0.001%。

⑥ 得物:在批量写入设置上设置最大写入条数,耗时基本也能保持在毫秒。目前 Sentinel 的数据没有使用副本,全量数据分散在三台机器中,根据计算得知 TDengine 对于 Sentinel 监控数据的压缩率达 10%,相当可观。

⑦ 货拉拉:将监控的数据存储由 MySQL 改造为 TDengine 后,不仅顶住了监控数据增长所带来的压力,还节约了存储空间,成本压缩到了原来的 1/10 甚至更低。历史原生监控数据可回溯时间也变得更长,之前存储 3 天原生数据及聚合数据的空间,现在可供原始数据存储 45 天。

金猿投融展_涛思数据_大数据-4

技术能力说明

1、高性能时序数据库

充分利用时序数据的特点,通过创新的存储引擎设计,无论是数据写入还是查询,TDengine 时序数据库的性能比通用数据库快 10 倍以上,也远超其他时序数据库,存储空间不及通用数据库的 1/10。

2、云原生时序数据库

通过原生分布式的设计,充分利用云平台的优势,TDengine 时序数据库提供了水平扩展能力,具备弹性、韧性和可观测性,支持 Kubernetes 部署,可运行在公有云、私有云和混合云上。

3、开源的时序数据库

TDengine 的研发始于 2016 年 12 月。经过 2 年多的研发后,TDengine 团队在 2019 年 7 月将单机版开源,2020 年 8 月又将集群版开源。2022年 8 月,TDengine 发布 3.0 版本,成为一款真正的云原生时序数据库。

TDengine 项目十分活跃,到目前为止,TDengine 项目在 GitHub 上总共收获了 20.3k star,全球安装实例数已经超过 183.7k,用户遍布全球五十多个国家和地区。

金猿投融展_涛思数据_大数据-5

TDengine 全球运行实例分布图

4、强大的数据分析能力

TDengine 是支持 SQL 的时序数据库,对于数据分析师而言,使用 TDengine 就像在使用一个关系型数据库。而且通过超级表、存储和计算分离、数据按时间分区、预计算等多种手段,TDengine 提供了强大而又简单易用的分析能力。

5、简单易用的时序数据库

TDengine 作为一款时序数据库(Time Series Database),为时序数据的处理提供了一强大而又简单易用的平台。一个数据采集点一张表、超级表和标签的核心设计使得写入和查询的性能极大提升,而且让组织和查找数据变得更加简单。对于数据库管理员来说,TDengine 显著减少了系统部署维护和管理数据的工作量。对于开发人员来说,TDengine 提供了简单的接口、极简的解决方案,并支持与众多第三方工具的无缝集成。对于数据用户说,TDengine 提供了便利的获取数据的方式。

6、支持 SQL 并对时序数据处理进行扩展

众多的时序数据库(Time Series Database)以及传统的实时数据库(Real Time Database),都采用自己的查询语言,有的甚至只能使用 API 来做查询。TDengine Database 从诞生的第一天起,就采用 SQL 做为自己的查询语言,因为 TDengine 团队认为 SQL 是世界上最简单易用、最流行的查询语言,为众多程序员所喜爱,这样能够降低学习门槛和应用程序迁移成本。同时,为方便大家对时序数据进行分析处理,TDengine Database 对标准 SQL 进行了扩展。

近年营收及未来预期

涛思数据在产品研发上市的第二年开始,销售额已突破千万,近几年营收均以每年3至5倍的速度增长,且值得关注的是,2022年开始启动美国为首的北美市场,已经开始收获客户。

根据 IDC 发布的 2022年版《全球物联网支出指南》(IDC Worldwide Internet of Things Spending Guide)提供的最新预测数据,2021年全球物联网(企业级)支出规模达6,902.6亿美元,并有望在2026年达到1.1万亿美元,五年(2022-2026)复合增长率(CAGR)10.7%。其中,中国企业级市场规模将在2026年达到2,940亿美元,复合增长率(CAGR)13.2%。全球占比约为25.7%,继续保持全球最大物联网市场体量。涛思数据希望成为时序数据库的事实标准,逐步增加在行业内的占比。

企业负责人

·陶建辉 TDengine创始人·核心研发

1986年考入中国科大,1994年到美国印第安纳大学攻读天体物理博士,曾在美国芝加哥Motorola、3Com等公司从事无线互联网的研发工作,在高可靠分布式系统、即时通信、消息队列等方面,是顶尖的技术专家。2008年回到北京创办和信,专注移动互联网IP Push和IP实时消息服务,2010年和信被台湾联发科收购。2013年再度创业,创办快乐妈咪,专注母婴智能硬件和母婴健康服务,2016年初快乐妈咪被太平洋网络收购。2017年5月又再次走向战场,创办涛思数据,专注时序空间数据的实时高效的处理,其自主研发的产品物联网大数据平台TDengine比其他业内标杆性能好10倍以上,可广泛运用于物联网、车联网、工业大数据等领域。

融资情况

已获得合计近 7000万美元融资。

• 2020年1月获GGV纪源资本,红杉中国种子基金、永辉瑞金的Pre-A投资。

• 2020年4月获红杉资本中国基金、GGV纪源资本的A轮投资。

• 2021年5月获得经纬中国、红杉资本中国基金、GGV纪源资本、指数资本的4700万美元的B轮融资。

投资人评价

中国在物联网领域有全球领先的技术累计和设备链接数量,而且还在快速增长。涛思数据作为专门应用于物联网场景的时序数据库,可以大幅提升存储、查询、分析和计算效率,让物联网应用开发更便捷。我们看好涛思数据在开源社区持续扩大影响力,赋能更多开发者。GGV也会持续支持公司的发展,成为具有全球影响力的中国基础软件公司。

——GGV纪源资本管理合伙人 符绩勋

随着消费、能源、工业、智慧城市等多个领域物联网应用的快速渗透,物联网的接入设备数和数据量在高速增长。涛思数据瞄准日益增长的物联网大数据市场,产品定位精准,在物联网市场形成了强竞争力。其核心产品TDengine,通过开源方式获得开源社区的大量正向反馈,得以持续快速迭代。开源的影响力也带来了付费用户数量的快速增长。相信B轮融资后,涛思数据能够继续扩大在物联网大数据领域的优势,将TDengine打造成全球领先的物联网IoT数据处理平台。

——红杉资本中国基金投资合伙人 吴茗

客户评价

具体到实际业务中,TDengine 表现出了优秀的性能。以存储性能为例,之前我们使用 ES集群时,15个节点只能支持3个月的数据存储,在接入 TDengine 之后,7 个同样配置的集群,已经支撑了 5 个月的数据存储。基于 TDengine 在当下业务中所表现出的优异成绩,我们在未来考虑向 TDengine 中接入更大规模的轨迹数据以及其他业务中的时序数据。也希望未来我们能借力 TDengine,实现大量的轨迹计算及挖掘,将公司内部的数据实现快速变现,加速充电桩业务的发展,依赖 LBS 帮助客户挖掘更多的潜在客户,实现多边共赢。

——四维图新位置服务部门数据平台负责人 曹志强

在存储方面,在使用 TDengine 之后,针对生产环境的一个 6.6TB 的集群,我们粗略估计了一下前后的压缩比,大概在 6.6/0.4。

在我们原来的集群中是没有副本的,单纯就部署了 MySQL 的 5 个分库,使用了 4C 8GB 2TB 的 5 台机器,在应用 TDengine 之后,现在是 8C 32GB 2TB 的 3 台机器。通过 TDengine 我们构建了多副本和统一的能力,以及后续上混合云的能力,这是整个平台级的一个优化与提升。

——OPPO 高级后端工程师 唐恒建


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

【年度榜单】2020大数据产业创新服务产品丨数据猿·金猿榜
【年度榜单】2020大数据产业创新服务产品丨数据猿·金猿榜
【金猿投融展】百炼智能 ——用科技, 让B2B营销更简单
【金猿投融展】百炼智能 ——用科技, 让B2B营销更简单
【金猿案例展】某石油炼化企业——炼油化工大数据低代码建模平台
【金猿案例展】某石油炼化企业——炼油化工大数据低代码建模平台...