大数据时代下的金融分析云平台

【数据猿导读】 日前,以太携手斯道资本在上海开展了“科技推动金融”的主题沙龙,上海寰融信息技术有限公司首席产品官童中伟先生进行主题为“大数据时代下的金融分析云平台”的演讲,本文是由演讲实录整理得出

大数据时代下的金融分析云平台

首先感谢以太和斯道资本邀请我跟大家交流,特别是以太给了我们融资上很大的帮助,使我们省了很多心,让我们专注于产品的设计,希望以后这种活动更多。我今天的主题是“大数据时代下的金融分析云平台”。

首先想象一下大数据时代下的平台是不是还像以前一样?20年前做人工智能的时候我们解决的是玩具智能问题,因为那个时候还没有大数据,硬件、软件都跟不上。我在大学的时候花了几天写了一个下五子棋的程序,把班级里所有的同学都打败了。但是发现一个问题,我本来下五子棋不错,不用程序也可以把他们打败。既然这样的话做这件事情还有什么意义?当然有意义,因为人不可能同时跟所有人下棋,每秒钟下一步棋就更不行了。有了这个程序可以同时打败班级里的同学。

现在的人工智能都解决了现实生活中的问题,这次AlphaGo击败了李世石。背后的AI非常强大,很快就可以在很多职业上替代人类。但如果把黑箱子打开,跟我20年前做的一件事情很像。AlphaGo的团队本来下围棋就很厉害,非常有专业知识,他们又非常了解人工智能的技术。所以他们把技术加上人工智能的算法,然后利用大数据集合了至少一万人的技术。说是AlphaGo击败了李世石,不如说本来下围棋很厉害的专家用更好的工具击败了李世石。李世石下围棋的时候没有使用什么工具,如果李世石用了AlphaGo的工具,这个结果在国际象棋领域已经发生了。

这个事情其实跟金融领域很像,金融领域的对手都不像李世石,他们已经在用很多工具了,他们已经在作弊了。在金融领域我们需要更好的人工智能工具,更好的大数据应用才能击败对手。有一点跟刚才的故事有点像,假设AlphaGo背后的这些程序员把程序写好之后就没改变任何的参数,让它和李世石玩了五次吗?我们猜肯定不是这样的。我们都知道其实每下一盘棋有可能背后就重新调了一些参数。有可能李世石在跟AlphaGo下棋的时候,每一步背后的程序员都在调参数,有可能都在修改。

金融领域里,相关人员在跟市场交锋的时候,每时每刻都在调参数。很好的例子,他们是用人工智能大数据,其实每天的参数、交易系统都在调。为什么会是这个样子?因为金融行业现在的状况不像20年前,长期资本的时候,那帮人出来之后策略是可以很稳定的赚钱。但是这个时代一去不复返,那个时候金融领域竞争的对手还比较弱,没怎么用工具。我进入华尔街的时候,那个时候很多PHD同时进入了华尔街,工具都更厉害了。现在一个策略可以跑十几年的情况很少,必须用工具不停地开发新的策略。

人工智能在金融投资领域的应用是个必然的趋势。这也是华尔街简要的概况,随着各种各样投资者的类型、品种等等爆发式的增长,所有投资策略的研究也会跟着爆发式的增长。你挑两个投资的品种可以做一个选择,挑三个品种可以做一个交易,这些都必须用很复杂的人工智能算法。各种数据都出来之后,特别是最近出来的很多高频数据,人基本上搞不定,我们发现第二个领域,不是在衍生品,在高频领域全是机器跟机器打。第三个领域就是各种各样的大资产配置,基金经理和分析师研究股票的市场如果不用工具就变成一个体力活。

金融大数据使用上的痛点

说一下现在的痛点,不像二十年前功能很少,数据很少,我们都能记得住屏幕,用一个搜索就能够找得到数据。现在功能太多,数据太多,如果有一个市场机会出来,连数据都找不到的话,那个机会可能就过去了。用关健词搜索相关的数据,特别是你都不知道相关的数据叫什么的时候投资机会可能就跟你无关了。

第二个痛点就是刚才谈到的金融行业,大家都使用比较稳定的工具赚不到钱。金融行业大数据分析的工具必须做过很多定制化,最好用最低的成本、最快的速度做定制化的工具才能抓住市场的机会。在金融界开发一个策略很贵,像AlphaGo开发一个策略有可能三到六个月,市场的机会就没有了。

第三点金融大数据服务不像B2B市场,不能用比较精准的办法推送给客户。这种算法在金融行业没怎么用,所以金融行业的分析是加了几百个微信群,整体收到群发的一堆消息,基本上看不过来。我们现在的解决方案是基于大数据深度关系的人工智能技术。

简单说一下我们用到的大数据,其实数据的广度比AlphaGo用的数据广的多,我们稍微做一个分类。首先,是获取的数据。数据获取的成本从高到低,数据的适用范围也不一样,各种各样的标准,但是这种数据不是很多,而且只要有钱都买得到,如果只用这些数据的话有可能开发出来的策略不行。第二点,是自有的数据,这些数据有可能就是你的交易机构,分析的机构,基本上是不卖的。第三点,是抓取的数据,政府网站、行业协会网站的数据。第四种和AlphaGo很像,这些数据是自己生成的,通过原始数据自动生成的一堆数据,再去做分析,这种数据获取成本是最低的,但是适用范围不怎么广。

稍微简单介绍一下各种各样数据储存的方法是不一样的。我简单介绍一下AI技术,从比较容易理解的到很难理解的,底下是AlphaGo。它使用的是比较容易自动学习的技术。说一下浅层关系和深层关系的区别。文本和文本之间参数引用关系,第二种就是数据的相关性,第三种是社交网络中的人与人的关系。我们比较注重的是程序间的关系。

说一下KENSHO这家公司,它是通过一种模型及海量的浅关系猜测可能的深关系。我们用的数据深层关系种类更多一点,可以更多的做自定义。Palantir这家公司分析了各种各样的大数据深度关系,他们分析数据的方法都非常多,我们是专注于金融领域。我们猜测(对方)为什么一开始没做金融?因为在美国金融行业不像国内,已经有了很多的积累,壁垒太高了。我们做了一件什么事情?我们通过人工智能算法学习了超过40万册的专业金融书籍和论文。

简单介绍一下最后实现的目标,跟一般的金融软件相比,我们一个新手也可以很快的完成一个尽职调查,不需要非常复杂的流程,我们的用户可以很快的开发出一个量化的策略。可以用很短的时间找到某种指标或者某种策略,然后实现关健词搜索达不到的事情。

这边讲几个场景。我们可以用大数据精准的推出一些信号,因为现在信号是群发的,发出去的信号对某些客户非但无用而且有害,能用的话也浪费时间。所以用我们的系统可以精准的推送某些择时信号,推到最需要的客户手里,能够证明用了这个信号什么时候、什么情况下对你的业绩会带来更好的收益。

第二个案例是中国刚起步的行业,中国公募和私募数据已经超过股票数目了,这个事情在美国已经发生了。在这种情况下美国的FOF行业按照市场的比例来说比中国要大十倍,有广阔的空间。但是中国现在的市场缺乏这些专业的人士和工具,如果这种情况调研基金很有可能被PM忽悠,也问不出非常精确的问题。如果用国外的软件,一个是非常贵,门槛又非常高。所以我们图略家给他们的解决方案是定制好了非常多的流程,使一个不熟悉的,没有太多专业能力的公司也可以做非常有效的调研工作和自动基金筛选的工作。一般的调研和筛选基本上没法回答这个问题,PM的选股策略在最近市场情况下表现好不好,说的某些观点和事实能不能用数据验证,用现在的工具基本解决不了这些问题。

金融领域应用AI的三大条件

最后说一下我们的机会,大家面对的都是一个巨大、广阔的机会,刚才提到政策导向下中国的长期机会有点像美国市场,一个是SEC的成立和金融反腐。因为人工智能应用有几个条件,第一必须有大量公开的合法数据,如果所有的交易全是内幕交易(就不行),没有数据是不行的。第二个是货币政策,你需要一个长期的市场来吸引更多的专业人士和钱去做这件事情,因为AI一点都不便宜,需要硬件、软件、非常多的专业人士做很多数据。如果这个市场长期爆发式的增长,对我们AI大数据技术是非常有利的。第三点是金融改革,如果金融不改革不利于竞争。如果竞争全面放开之后,金融行业AI和大数据服务竞争需求会爆发。这是必然的结果。


来源:以太创业专栏

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

我要评论