܄

佳格大数据创始人张弓:聚焦农业大数据

【数据猿导读】 农业每一块地的操作方式,包括最终的产值都不一样,它需要非常多的去考虑空间关系的数据集

佳格大数据创始人张弓:聚焦农业大数据

什么是空间大数据

我们定义的空间大数据可能是比较狭隘的概念,即具有很强的空间属性,例如:“淮南为橘,淮北为枳”这种空间变化非常明显的,包括环境污染、地质等在空间分布上都有一定的分布规律,这种分布规律又很难用常见的一维数据来显示,所以我们把它称之为空间数据。下面这张图中简单列举了几种空间数据。

还有一种说法,管这种空间数据叫环境类的空间数据。环境在我的理解当中是“环我之境”,就是环在我周围的影响因素。在一个越高度发达,越精密的社会中,对外界的数据就越敏感,这些外界数据对整个生产的运行起到非常重要的作用。

这些空间数据会有一些天然的属性,比如:数据量大、对响应速度要求很高、数据种类多等。在一些跟空间数据相关的领域,是非常需要这一类空间数据的,但是因为我们的处理能力、计算能力、存储、显示等等都不是特别完善,所以导致这种应用是比较滞后的。随着最近一、二十年存储技术的进步,我们有了一些新的利用大数据工具去处理这类空间数据的方法,使得这些数据能够比较好的被应用。

上面这张图展示了一些国外近些年发展出来的大数据处理工具,它们可以对空间数据进行更快、更高效的处理。有了处理能力以后,我们能够干什么呢?

这是一张卫星的图片,我们可以看到左下方是以前的卫星拍摄的。随着最近一段时间各种技术的进步,我们可以将它做得非常小,这时候我们就可以很廉价地获取这些数据。大家最近可能听过一个火箭发射几百颗卫星的新闻,其实很多都是这种类型的卫星。有了这些廉价的数据,我们就可以从里面得到非常有价值的信息,但是这些数据都是图片,展开来像地图一样,这里面的信息需要通过新一代的机器学习方法自动识别出来。

从卫星的图像上面,我们可以看到很多圆圆的东西,这些圆圆的东西实际上就是油罐,世界上绝大部分原油都储存在近海油港的油罐里面,那么如何知道世界上绝大多数原油的储存量呢?是不是能够从图片里面就能得到这些信息呢?这看起来是挺困难的联系,但实际上也很简单。

从上面这张图可以算出来图像里面的所有油罐的储油量。我们可以看到每个罐子里面会有阴影,类似于月牙,实际上那是油罐的盖,因为盖太沉了,所以它只是浮在油上,油一旦少了以后,盖就会落下来,它的阴影就会更深一点。所以我们看到阴影深的地方就是油少的地方,阴影浅的地方就是油多的地方,计算公式就是高中数学的知识。所以,这个过程看起来是很简单的。但是,在这之前如果没有比较廉价的卫星图像获取方式和相对高度自动化的图像分析工具,实际上是很困难的一件事。那么,如何识别世界上所有地方的油罐呢?其实并不是那么容易就能找到所有的油罐,因为世界非常大。

这是美国另外一家创业公司,他们通过对海量数据的分析,利用机器学习和深度学习的方法,去找出这些有油罐的地区。这里面其实遇到了很多的技术瓶颈,比如:如何处理大量的图像,如何快速寻找特征物等等,这些都是很大的挑战。但是在IT技术高度发达的现在,这些原来的技术门槛都被跨越了,我们现在能够去分析这些数据,从里面发现有价值的信息,包括原油储量等。

上面这些是和空间数据,特别是与卫星获取的空间数据有关的一些创业公司。我们可以看到这里有欧洲的公司,还有很大一部分是美国公司。

空间数据的农业应用

农业数据是空间数据的一个子集,因为农业数据需要靠外界的空间数据感知方法才能够将农业数据真实地表现出来。农业每一块地的操作方式,包括最终的产值都不一样,它需要非常多的去考虑空间关系的数据集。

上面这张图列举了一个例子,TheClimateCorporation在2013年10月以11亿美金被Monsanto收购。我们可以看到,图像中的左边是它们的核心产品Fieldview,实际上是通过卫星、地面采集、气象模型以及土壤模型得到的空间数据。图里面显示的就是土地的播种密度、产量等等相关因素在空间上的不同分布,其实可以分成很多的空间层。然后以这种空间数据的累加为核心,给出最合适的种植方案,这个种植方案不仅包括什么时候播种,还包括用什么样的种子、农药、耕作方式,甚至用什么样的收割机等。这也是Monsanto对他们有兴趣的原因。实际上,他们是通过空间数据将农业中间相关的比较长的种植过程,通过数据链接起来,实现一种以数据为纽带的,一体化的农业服务系统,这里面包括农资、农机以及后面的农产品销售等环节。

Monsanto是世界上的几大农业巨头之一,除了Monsanto以外,Syngenta也收购了类似的一家数据公司——AgConnections。

农资公司还包括一些生产类型的公司,比如:Landlares是美国一家类似于合作社一样的超大型公司,他们很早就布局了空间信息,收购了一家西班牙的卫星公司叫Geosys。他们最早从牧场开始,扩展到农业的各个相关环节,提供从农资到种植方案,到收获,到最后售卖农资产品等,通过数据将整个环节串联起来,得到一个高效稳定的产出。

这一市场里面除了农资公司还包括农机公司,他们从农机的角度去收集、分析、甚至去操纵数据,比如现在特别热门的自动驾驶。其实在农机领域的自动驾驶早就实现了,甚至在中国有些地方就在用。

以上不管是农资公司、农业种植公司、农机公司还是全产业链公司,其实他们都在聚焦农业大数据,因为农业大数据能够真正实现对农业的详细管理,这在以前是无法做到的。之所以美国会有以农民为主的相关产业,就是因为空间的差异性使得这种大规模的种植是很难的,但是随着我们对空间数据分析能力的增强,可能以前我们需要某个农民才能知道这块地的情况,现在通过空间数据的分析,我就能知道每块地应该种什么,怎么种。这样我就能给出相对精准、甚至可控的方案。

中国农业数据的应用现状

目前,中国的环境和欧洲、美国还是不太一样的,我们是在一个比较破碎的环境里面去做相关的农业操作。所以,这些技术的应用可能适用于中国的某些区域,但是在中国的大多数区域,还是处于人均耕地比较少、土地比较破碎的状态。

但从另一方面来看,中国农业集约化的进程和农业的生产方式在发生巨大的变革,最终肯定会发生变化。随着人口结构的变化,农村劳动力的短缺,包括其他因素的推动,使得我们国家的农业在走向集约化或者中央鼓励的适度集约化。

实际上,集约化是非常有利于数据收集的,只有拥有这样的数据,才能够做更好的土地归集、整理乃至交易的内容。国家也在政策层面做一些改革,包括最近在做的土地流转等相关信号的释放。但是我们觉得目前在中国,这类数据还是很缺乏的,不管是土地还是作物、气象等数据在实际应用层面都是非常缺乏的,可能部分是在国家层面。这也是我们通过空间大数据去做相关工作的一个初衷。我们觉得在中国,例如北方的一些区域是可以像欧美一样通过农业数据来指导大规模种植,辅助中国农业的适度集约化过程,包括土地流转、土地托管、代耕代种等等。

实际上,中国农业还缺乏一些大数据,农产品的市场行情每时每刻都在变化,在价格变化中吃亏的可能更多的是种地的人,他们掌握不了规律,导致很多损失。从种植到收获,包括最后相关的消费数据都是极其缺乏的,所以需要一种方式能够快速收集和分析这些数据。我们觉得不管是通过气象、气候数据,还是其他卫星得到的播种面积等相关数据,是能够有效解决生产这端数据供给的。

 


来源:拓扑社

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

大数据投融资周报(4月5日——4月7日,共9起)
大数据投融资周报(4月5日——4月7日,共9起)
大数据周周看:今日头条近10亿美元融资入账,Adobe推出体验云平台Experience Cloud
大数据周周看:今日头条近10亿美元融资入账,Adobe推出体验云...
【独家首发】数之联完成A轮数千万元融资,大数据分析挖掘领跑者获资本青睐
【独家首发】数之联完成A轮数千万元融资,大数据分析挖掘领跑...

我要评论

精品栏目

[2016/10/10]

大数据24小时

More>

[2016/09/26-7]

大数据周周看

More>

[2016/09/01-30]

大数据投融资

More>

[2016/11/28-2]

大咖周语录

More>

[2016/11/29-6]

大数据周聘汇

More>

[2016/12/06-13]

每周一本书

More>

返回顶部