܄

中国工程院院士&曙光公司董事长李国杰:我们需要以大数据为基础的“元素周期表”

【数据猿导读】 如今,越来越多的公司加入到了大数据挖掘,期望在大数据中挖掘出意想不到的“大价值”。李国杰强调,为顺应大数据时代潮流,我们需要重新构建一张以大数据为基础的门捷列夫周期表(元素周期表)

中国工程院院士&曙光公司董事长李国杰:我们需要以大数据为基础的“元素周期表”

元素周期表的发现,为化学成为一门独立科学奠定了重要基础。李国杰说,为顺应大数据时代潮流,我们需要重新构建一张以大数据为基础的“门捷列夫周期表”。

大数据时代瞬息万变,每一个科技公司都希望走得更快。

一个月前,亚洲第一大高性能计算机厂商——曙光信息产业股份有限公司(简称曙光公司)宣布了它的“数据中国加速计划”,提出要加速网络布局、加速数据汇聚。

一年前,曙光公司提出“数据中国”战略,决定从“硬件与解决方案提供商”向“数据服务商”转型。这一年,曙光公司的云计算中心“落子”全国20多个城市,运行超1000个种类的政务运用和智慧城市应用。其中,一项致力于惠民工程的“身份认证云”应用在全国20多个省市的社保领域。

而曙光公司的董事长,正是中国工程院院士李国杰。他的主要研究领域是并行处理、计算机体系结构、人工智能、组合优化等。

曙光正研制大数据一体机

尽管李国杰17岁就参加了第一次高考,但由于历史原因,等他真正开启事业时,已经43岁。1987年,他从美国伊利斯诺大学完成博士后回国,进入了中科院计算技术研究所。

回国后,李国杰这块“金子”快速地发光。1993年,他带着数名年轻人,成功研制了中国第一台高性能计算机“曙光1号”,仅过了三天,西方国家便宣布解除对中国的10亿次计算机禁运。

20年后,李国杰回首往事,感慨“曙光1号”打破了一栋“玻璃房子”。他介绍,早年国家进口超级计算机,外国人要监控,就像有一个“玻璃房子”,不让中国人进去对产品进行操作、管理。

从“曙光1号”到“曙光1000”、“曙光4000”,“曙光”家族迅速壮大。目前,安装在国家超级计算深圳中心的“曙光星云”,已经是世界级的大“Boss”。

“曙光星云”究竟多厉害?它拥有相当于20万台个人电脑运算能力的总和,最大存储量相当于80个国家图书馆的藏书量。在2010年第35届全球超级计算机“TOP500”中,它以每秒系统峰值三千万亿次(3PFlops)、每秒实测Linpack值1.271千万亿次的速度,取得全球第二的佳绩,并成为世界上第三台实测性能超千万亿次的超级计算机。

为更好地在大数据时代立足,李国杰透露,曙光公司目前正在研制适合大数据和云计算的大数据一体机、云操作系统和新型存储系统等新产品,他本人牵头的“973项目”正在研制面向大数据的高通量计算机。

“曙光”的技术上不断突破,管理方式也在不断进步。曙光信息产业有限公司成立后,李国杰出任董事长,成为“学院派掌门人”。2014年,他带领这支超级计算机领域的“国家队”登陆上海证券交易所。

大数据也要“元素周期表”

如今,越来越多的公司加入到了大数据挖掘,期望在大数据中挖掘出意想不到的“大价值”。

但是,李国杰提醒,大数据对经济的贡献并不完全反映在大数据公司的直接收入上,应考虑对其他行业的贡献。

为了说明大数据的价值,李国杰引用了一则寓言:一位老农民临终前告诉他的3个儿子,他在自己家的地里埋藏了一罐金子,但没有讲埋在哪里。他的儿子们把他家所有的地都深挖了一遍,没有挖到金子,但由于深挖了土地,从此庄稼收成特别好。

挖数据正如挖金子。李国杰认为,数据收集、分析的能力提高了,这也是一种价值。

李国杰强调,为顺应大数据时代潮流,我们需要重新构建一张以大数据为基础的“门捷列夫周期表(元素周期表)”。

“‘元素周期表’的发现,为化学成为一门独立科学奠定了重要基础。而在很多学科中,我们也需要对某些基本元素进行系统分析。”李国杰表示,目前生物领域有基因组学,生理学、病理学、干细胞等领域都在研究“基因组”,也有人讨论人类语言的“基因组”,这些基因组其实都是构成学科整体的基本元素。

发现“基因组”需要通过计算机对海量数据进行分析,这导致各学科领域纷纷出现“某某信息学”的分支学科,凸显了大数据在许多学科中的基础性作用。

“从上世纪70年代开始,围绕计算复杂性,已形成了以算法研究为中心的计算机科学。但随着计算机科学与其他科学的交叉融合,其研究重点将逐步转移到以研究各种‘基因组学’为重点的数据科学。从这个角度来说,现在已经到了发现一张新的‘元素周期表’的时候了。”李国杰说。

有了这张数据科学的“元素周期表”,大数据时代的数据特性、数据联系将更好掌握。


来源:涂子沛频道

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

旅游交通大数据——大众旅游时代的“富矿”
旅游交通大数据——大众旅游时代的“富矿”
【金猿人物展】张涵诚: 2020年大数据产业发展将进入深水区,产业价值必须量化
【金猿人物展】张涵诚: 2020年大数据产业发展将进入深水区,产...
【金猿案例展】国网上海市电力:智能配用电大数据应用平台建设
【金猿案例展】国网上海市电力:智能配用电大数据应用平台建设

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部