明略数据综合事业部高级经理葛利鹏:用好大数据 走好制造强国之路
【数据猿导读】 在第九届中国软件渠道大会暨2016中国软件生态大会北京站上,明略数据综合事业部高级经理葛利鹏在会议上做了主题为“开启大数据关联挖掘的新时代”,展示了大数据在国家电网等关键行业领域的应用

分享一组数字,32.7%、1:9和每分钟15万代表什么意思。随着我国经济的发展,制造业在我国经济中扮演了非常重要的角色,随着我国经济进入了新常态,可以看到2015年乃至整个我国产业的风险投资中,制造业依旧占了非常重要的位置。
明略数据综合事业部经理葛利鹏
同时制造业从我们的生活各个方面都密切相关,我们的衣食住行都依赖于制造业,虽然我们出行所来说,中国的高险在十年内得到了迅速的发展,这也是依赖于一个原则。纵观我们高铁生命周期,我们就可以发现10%的资金和投入在哪?购置上。9%的资金后期的维护和保养上,这是一个1:9的来历。现在企业总关心的一个问题是什么?我们怎么样在降本增效的前提下,能够保障高铁顺利的运行和安全。
但是由于这种故障造成的停车每一分钟经济损失15万,一小时将会带来900万的损失。现在我们整个每天高铁的运行量大概一千多列,可见这数字非常的庞大。
怎样才能够及时地发现问题、解决问题呢?
这是我们非常关心的问题。随着第四次产业革命的到来。各个国家、各个工业强国都在推出自己的产业政策,来提升本国的制造业发展水平。德国有工业4.0,美国工业互联网。我们中国的这种制造业有中国自身的特点,我们的体系非常庞大2010年超过了美国,成为了世界上第一制造业的大国。但是我们中国有一些弱点,例如我们的产业结构不是很合理,自主创新能力不强。
所以呢我们中国政府提出了中国制造2025年的产业政策,这政策主要是以数据,为纽带,以数据分析为驱动力。具体到社会制造的领域我们可以看到三个方面:1、数据分析、故障诊断、3恩、故障的预测。
在数据分析我们主要是利用这种分布式的存储、计算技术,对于全国的海量数据,可以进行状态监测,可以提供全生命周期的分析,对于故障诊断局部部件的微小问题的采取措施。其实对于故障预测来说对我们也是一个非常大的挑战。我们公司大数据科学家也投入了主要的资金和经历在这方面,也就是研究如何来建模,如何来真正的实现故障的一个预测。主要是推动故障预测由之前的人工化、抽样化,向智能化全面化的方向来转变。也就是由之前由于专家来进行判断,现在依靠技术通过数据的手段来进行故障检测。
从现在的故障处理上我们可以看到有三种不同的方式,有时后、有定期维修还有预测性的维修等等。我们现在大家都有车,我们每跑700多公里,我们要进行定期的维修,同样一种故障现状,在不同的生命周期里它是不一样。就是说你的车处于磨合期,和处于损耗期,你应该采取不同的措施。大是现在由于技术手段的缺乏,我们并不能够进行周期性的判断,所以说我们会用到大数据的技术。大数据的技术在这方面主要的特点是什么?我们提到了两点,第一点快速,第二点高效。快速主要是利用大数据的背景计算和处理能力,使得我们能够第一时间发现故障在哪里,及时地采取措施,高效主要是利用我们大数据的并行计算的数据模型。能够将一些看似微笑,但是实际上在故障发生作用的状态数据,放到我们整个模型里面来进行统一的考虑。这样会造成非常高效的运算和非常高效的预测,这是我们真正能够达到预测的一个效果。说到大数据的特点我们说高效果
我们的客户到底在哪里?
通过实践我们发现,关注国计民生大的行业,实际上应该使用大数据的技术,有几个特点,第一点是他们的单体设备的竞争非常昂贵,一旦发生了损失,不能够进行预测,将来造成了很大的经济损失。第二这些大的系统会有传感的条件。像我们的高铁一样。它整列的传感系统就像一天两百多个包括温度、速度、电流、电压等等。所以说这些传感器在高铁会产生大量的数据,这给我们提供了一个很好的数据基础。有了数据的基础我们还要把它传回来,以便于我们采集和分析。在高铁上就用了移动网络进行数据的运维,就给大数据落地提供了一个很好条件。也就是我们能够真正做到故障的预测。
明略数据提供什么样的解决方案
上面谈到了大数据的特点和客户,下面我们看一下,我们明略数据提供什么样的解决方案给到客户,才能够真正的实现故障的预测。首先我们提供了完整地架构,主要分为四成,下面由我们的数据源,中间由我们的数据采集和挖掘。数据采集和存储,再往上有我们的数据挖掘。最上面我们也会提供数据解释。在数据源这儿,传感器数据,包括一些历史数据都是属于结构化的数据。
大数据平台就是采集和存储的任务,再往上我们会对采回来的数据通过我们的建模手段,进行诊断模型的建立和故障预测的建立,来完成相应的工作。
我们明略公司提供全套的产品,不仅提供了大数据的平台,或者MTB的大数据平台,同时我们有相关的诊断和预测的平台。同时我们会提供可视化的平台。
这样通过我国完美的配合我们就会给客户非常完美的解决方案,也就是从数据的采集,到数据的分析挖掘,到数据的可视化展现一整套的解决方案。在大数据应用中,我们就会说数据其实是基础,但是真正实现数据价值,发现有价值数据的方法,只有通过数据的建立。传统来说有两种比较好的方法。第一是特征挖掘,在特征挖掘里面主要通过几个步骤来实现,首先我们通过故障的标注观察数据,同时我们会对于观察完的数据进行特征的提取。特征提取后呢,我们会感觉数据的手段,我们会观察数据是否具备降本或者是筛选的特点进行相关的处理,我们会进行模型的训练。这个时候在这例子里面我们是用了SVA的模型,我们会把超平面弄出来,这后面就是我们将要做的一个模型,如果是通过模型的评估,一切都OK的情况下,也就意味着我们超平面在将来实际中使用的一个模型。
我们还会用到深入学习的模型,这也是前一段我们人机大战中比较火的阿尔法沟用的数据模型。在我们用的时候,我们基于大量的数据模型产生出我们真实的使用模型,由于这模型需要进行大量的预算,所以我们使用了GPU的储备工具来进行数据的处理,但是很多的案例上面深入的学习过程中已经使用了GPU,同时我们在典型的案例中,已经在使用了GPU的运营。特斯拉的架构它号称一个检查站八块GPU,它处理能力相当于250台通用的服务器,所以我们也会紧跟这一发展的趋势,来推动我们这种双模式的建立。我们认为基于对大数据的理解,我们才能更好的发现大数据的平台,同时要深入的理解客户的业务,也才能够更好地提出解决方案,解决方案其实是围绕客户的业务,就是说只有深入的了解客户的业务,我们解决方案才能更好的项目实践。
案例分享
下面我们会有两个比较典型的实践,一个是轨道交通,另外一个是我们的电网。这我们的实际案例,可能这企业是我们国内最重要的交通企业,它的主要问题是业务场景非常的复杂,同时建模工具缺乏,导致它不能根据故障及时的模型构建,也就不能够进行这种预测性的评估,导致了大量的浪费,同时由于这种高铁列车逐渐的自动化、智能化程度的提高。它的数据种类数据量也非常大。也会造成采集和分析包括查询都困难。
基于客户的痛点,我们提出了全套的解决方案,包括我们大数据平台DP,包括数据挖掘平台,同时我们根据客户的需求,将我们的展示工具和我们的平台进行很好的客户化改进。这能够使得我们的挖掘结果及时的能够反应到客户的界面上。客户就能够通过我们的可视化界面,就能够看到整车的运行状态。整车关键部件的运行状态,一旦部件发生问题,它同时能够看到故障的概率,故障的原因还有故障造成的结果,这样就能故障的特点及时的采取维修的措施,这样就能极短的降低了停车时间缩小了经济损失。
同时我们也会提供这种实时界面,包括快速查询还有预测的模型。下面我们看一下我们在实际应用中可视化的界面。
下面回到我们第二个案例,是国家电网,电力设备包括发动机主线路大电流的设备,二次设备主要是指的一些控制,包括检测仪表机电压的设备。这些设备每天会产生大量的数据,现在客户遇到的问题,这些数据不能够及时地存储和查询。
导致在查询的时候,时间长的甚至达到10分钟,所以这是客户所不忍受的。第二它的建模工具非常缺乏,不能够做到对于故障的预测性的判断。所以说它也不能够对于一些产品进行及时地诊断。
根据客户的痛点,我们给到客户,包括我们的大数据平台,包括我们的数据挖掘产品。包括我们的上面的展示工具在内的。这样就能够给客户起到全程的展示,快速的查询。同时我们解决了困扰客户的问题。
就是说可能一系列的产品中,它有一个产品不到两个产品发生问题,我就能通过这一两个产品,通过故障建模,不能够推断这一批次的产品将会发生问题,这样就能把这信息给到维修,能够采取有关的措施,保障电网的正常运行。通过全景的展示每一个结点包括发电机组是否有故障,这样就能够提供一个全景的视图,非常的直观。
大数据实施或者应用过程中的经验
最后我想和大家一起分享一下,我们大。第一就是在大数据实施过程中,我们认为这个数据技术和业务都是非常重要的,在整个项目中,但是实施过程中,我们发现其实数据和技术是围绕着业务展开的,业务技术驱动里也是数据和技术的最终一个价值点的体现。
所以说驱动解决方案,是我们的业务,只有真正的体现了业务价值,咱们的解决方案才是有价值的。
第二相信我们中国的技术力量,就是在第一个案例里,我们轨道交通的实际案例里面,我们的技术团队和客户的技术团队互相的接力。甚至在争论一个技术问题的时候,我们能够一起争论到凌晨,就是客户认真的态度、敬业的态度也确实激励了我们的团队。同时我们的数据科学家通过助场服务,通过助场服务才能真正的了解业务的特点,将来的业务发展趋势,客户对于业务的需求是什么,将来通过数据建模来达到业务的一个价值,现在通过我们的不断追求,项目运行非常好,所以说通过这些案例呢,我们觉得我们应该相信我们中国的技术力量。由于时间的限制我们只是举了制造业这一个案例,其实我们明略数据我们还有很多的实际案例,包括在金融业,包括在公安,保证在运营商我们都有很多的案例。
来源:中国软件网
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14