大数据 ·

【金融大数据】金融信息化二十年,金融数据在做什么?

?

21世纪以来,人类社会信息资源的开发范围持续扩大,经济、社会信息随着经济活动加剧得到空前的开发,信息资源总量呈爆炸式增长,我们从最初的“信息匮乏”一步踏入到“信息过量”时代。

个人如此,行业亦然:随着大数据应用的不断发展,金融机构的经营决策、营销服务越来越依赖于诸如新闻舆情、企业信用、热点概念等企业外部数据,而这些数据的应用场景也愈加需要与金融机构内部的数据打通,形成数据融合计算。

再加上人工智能的异军突起,大量非结构化数据正在被人工智能结构化掉,隐藏在文档中的信息价值正在不断的被“机器”发现并加以大规模的使用,大数据、人工智能让金融机构的数据治理工作又重新回到了“混乱”的起点。

一、金融大数据行业的发展

真正的金融信息化,应该是在1998年之后才真正开始的。为什么说1998年之后?因为当时我们在某银行做系统时就发现早些年的数据根本找不到。而到了2010年,金融机构的数据质量才慢慢好起来。

1.金融信息化二十年,金融数据在做什么?

  • 数据大集中

数据大集中是一个过程,之前整个银行体系都在分行,包括证券公司也是如此。这些金融机构并没有集中的数据中心概念,所以他们先做了数据大集中。

  • 数据仓库

数据仓库是在数据大集中的基础上,提升、改善了数据的质量。

  • 报表

在上面两步的基础上,做了两个报表:一个是监管报表,另一个是内部管理报表。

  • 决策支持

决策支持是基于报表而形成的系统。但是,最后形成的决策支持系统扮演的角色并不是全局性的。比如,针对风险部门的是风险数据仓库,针对业务部的是客户数据仓库,所以在金融信息化过程中,以上四个方面还是部分处于分离的状态。

2. 最近几年,金融数据在做什么?

  • 数据效率和即席分析

最近几年,大家又开始认为数据收集过多。对国内的金融机构来讲更是这样。实际上从数据的角度来讲,用户量实在太大了。现在我有几个同事在用Hadoop给银行做解决方案,大家发现数据效率已经成了非常大的瓶颈,因为其中有些计算实在太复杂。

原来从数据库导到数据仓库里,可以延时来算这个数据,但现在发现这样不可行了。最典型的一个案例就是“反欺诈”。 P2P现在已经有团伙性作案诈骗,这就导致选择模型很难,然而又不能像银行放贷一样速度很慢。所以我觉得,提升数据效率和即席分析这两个结合起来,诞生了非常多的机会。

  • 数据整合

无论做什么样的分析,数据质量是最重要的。如果数据质量差,很多事情都做不了。

公开数据现在越来越开放,比如说工商数据、征信数据。所以我觉得很多公开数据的运用,确实为qq不断发红包的群号码提供了非常好的基础。

  • 智能金融的尝试

为什么用尝试二字,因为我还是持一个比较保守的观点。就智能金融而言,现在的数据挖掘技术与人工智能技术还是不够的,但是我相信科技的不断发展肯定会解决这个问题。我一直坚信一个观点就是:以后绝对不会存在物理上云的概念。再过十年或者二十年所有的东西都是云,这就是趋势,是你没有办法改变的。我觉得智能金融或者大数据是一个趋势,是一个没有办法去改变、没有余地可讨论的趋势。

3. 银行、贷款机构的大数据应用热点

  • 信用评级+

这部分对金融机构来说是不可或缺的,无论是何种形式的评级都发展得很快。

  • 押品管理

这是大家没有解决好的一点。比如车贷评级还是一个弱项。

  • 实时放贷

银行在这方面的应用上其实要负一大部分责任。因为我们的金融体系还不健全,导致小额贷款难度较大。

  • 实时预警

提到实时放款就会涉及到实时预警。做到实时预警,需要将现有数据系统变成一个可计算的系统。整个的存储架构包括业务逻辑与数据计算的架构,都需要做出改变。实时预警并不仅仅是计算模型这么简单,贷前、贷中与贷后的实时预警都是必须的。如果大家有兴趣做,这会是一块很大的市场。

另外还有两个大数据的应用热点是“营销和客户分析”和“金融机构的工厂化”。

参与评论