立即下载 知乎日报 每日提供高质量新闻资讯

银行对每个人的信息都了如指掌的那一天,可能并不远了

图片:Yestone.com 版权图片库

大数据在银行传统信贷全流程中,有哪些关键作用?

Allen Yang,不会放贷款的银行客户经理一枚

银行信贷业务中所有的岗位、流程和制度设计都是围绕着一个主题:如何把贷款安全的收回来。展开来说,就是银行通过这套流程来判断这个客户在可预见的将来有没有还款的能力。

如何来判断某个人或者某个机构有还款的能力,这个问题并不只是在银行业出现之后才有的,自人类社会出现分工并产生剩余价值以来,借贷行为就出现了。“借贷”行为并不是简单的货币行为的借贷,借钱还钱只是最普遍的现象;借钱还粮食、借粮食还粮食等都属于借贷行为,在一段“借贷关系”中债务人只要能够最终拿出让债权人满意的“条件”就可以结清债务,这个“条件”可以是钱、可以是物甚至可以是人本身。比如“白毛女”的故事中,杨白劳就是欠了黄世仁的钱,最终拿喜儿抵了债。借贷行为并不只是存在个人和企业之中,国家也需要“借钱”。建国伊始苏联曾给中国大量经济和技术上的援助,中苏关系恶化以后,苏联把这种援助变成的“有偿”的借贷关系并要求中国“还债”,在外汇非常紧缺的背景下,我们只能用农产品、轻工业品抵债。

如何准确判断一个“人”未来有能力“还债”是一个始终困扰人类的问题,随着社会组织形式的日渐复杂,尤其是在“公司”这个概念出现之后,判断还款能力的问题就变得更加复杂。根据福布斯的统计,世界 500 强的平均寿命是 35 年,世界 1000 强的平均寿命是 40 年。大企业的寿命尚且如此,小企业则更短。在中国,超过 99% 的小企业会在 3 年内死掉,在中国创新最活跃的中关村,一家企业的寿命平均只有 0.97 年。假设中关村的一家企业问银行借款,一般银行的贷款都是一年期,在贷款还没有到期的时候这家企业已经死掉了。大家要知道现在的公司是“有限责任”的,一家公司破产清算时只以其最后剩余的财产对债权人负责,在没有其他还款来源的情况下,银行只能认赔。

因此,为了尽可能去了解某个企业的还款能力,银行需要耗费大量的资源去“了解这个企业”(搜集报表、实地考察、层层审批、贷后检查);此外还需要尽可能去寻找第二或者第三还款来源来预防风险(抵押物、担保方、企业实际控制人签署无限连带责任担保)哪怕在 5 年以前,大部分商业银行对小额贷款的门槛是 500 万元,其原因是如果低于这个数字,使用银行这套复杂、繁琐的风控手段,这笔贷款是要赔钱的。

近几年,银行开始借力“大数据”来作为风险控制的依据,其本质还是一种“了解你的客户是否有还款能力”的手段,银行希望通过“大数据”降低“了解你的客户”这个过程所需要的成本同时提升判断的准确度。以企业的纳税数据、银行账户结算量等数据为基础的贷款产品也确实降低了银行贷款的准入“门槛”,几十万元甚至几万元的贷款也成为了可能,解决了一部分小企业的“融资难”问题。

目前,银行对“大数据”的应用情况还停留在非常初级的阶段,只解决了“数据真实性”的问题。一直以来,银行对风险的定价依赖于财务报表,但是因为大部分企业的报表,尤其是中小企业的报表“真实性”很低,所以我们只能依托真实程度更高的纳税信息和银行账户流水作为主要的风险定价依据。举个极端的例子,如果所有的企业都“不做假账”,其实现阶段银行的大数据产品是没有存在的必要性的。

真正有能体现“大数据”价值的银行服务应该是目前以阿里的网商银行和腾讯的微众银行为代表的互联网银行正在实践的信贷模式,利用实时、动态、多维度、不断积累和更新的数据去对风险进行定价。以阿里为代表的互联网巨头掌握了个人或者企业大量的交易数据(电商买卖、信用卡还款、话费充值),同时鼓励客户不断的导入外部数据(比如芝麻信用就鼓励客户添加拥有的车辆信息),利用这些数据来判断客户的还款能力,并且因为数据是不断实时更新的,风控模型也在不断进行自我升级和修正来提升判断的准确度。基于实时动态的“大数据”的风控模型能够为每个客户完成风险定价(传统银行的方式是将客户进行分类,然后对每一类客户进行定价),未来你下一分钟能拿到的利率和上一分钟就可能会不一样(比如你刚好被发现闯了一个红灯导致借款利率上升)。互联网巨头们这种“获取数据”的能力也是银行所垂涎的,这点从各大银行纷纷推出自己的电商平台(工行融 e 购、建行善融商务)的支付产品(建行龙支付、招商一网通)就可以看出。

说一句更远的话,现在的大数据模型还是一种“中心化”的定价方式,大家愿意把数据交给阿里基于对阿里这个“中心”的信任,这种信任的成本还是很高的,比如一个美国的客户就没法通过阿里借到钱,因为阿里没有这个客户的数据。构建一个全球的区块链或许是一种解决思路,尤其当“区块链 + 物联网”就可以解决“信任”的问题。

设想一个场景,一名中国人将自己家的房子注册到这个全球的区块链上并且这个房子安装的是使用了物联网技术的智能门锁。随后,这名中国人来到美国创业,需要一笔钱,他可以把中国的房子抵押给美国的银行(区块链证明了房子的权属清晰),区块链对这笔交易进行登记并产生一个智能合约。一旦他还不出钱,智能合约会将房子的所有权划给美国的这家银行同时修改门锁中的密钥信息,哪怕他逃回中国也进不了家门了。

这一幕可能并不远了。

Sgt Pepper,相聚离开 都有时候

大数据在银行风控和其他业务中的应用这个话题比较好答,但我想多说一点儿。

我们都知道,传统银行业务有一套自己惯用的、相对行之有效的风控规则,简言之就是通过收益和风险的分析来判断是否有抵押物和利率水平之间的关系。在判断风险水平时,需要一系列的数据,包括但不限于财务数据、经营数据、上下游数据、以及日常开销、老板个人的一系列数据,这些数据可能不够大,但全都是围绕相关企业的核心数据,都是有用的。

现在银行能用得到的所谓大数据大都是用来营销的,在贷款风控环节中能帮到的忙并不多,银行特别是大行由于自身议价能力强,资质比较差的客户都会要求强担保,变相放松了资质审核。而资质比较好的客户大都来源于银行自身积累客户的二次营销,数据就从外部转向内部了。在个人客户领域,比较有用的是电信信息,也就是跟通话相关的信息(具体不多说了,不给骗贷者帮忙),这块信息银行可能会批量外包,但也很难谈得上是大数据。

对银行营销有帮助的数据,也就是现在一些大数据公司搞的东西,简单来说就是给客户打标签进行分类。为了打这个标签,就需要有用户的上网行为,比如你平时都开哪些 App、浏览哪些网站、在 * 博都关注了哪些人,发了哪些内容,将这些行为与标签进行关联。大数据公司拿着这些带标签的用户数据,去跟银行的用户数据进行匹配,对能打上标签的人进行二次营销。所以,你在网络上的一举一动都为你的用户画像填上一笔,区别是,有节操的公司只把用户画像内部使用,没节操的公司还会把用户画像卖到外面供其他人营销。

所有这些网络标签和用户画像,只有跟你这个真实的个人联系上才有用,不然只是互联网亿万初始头像中的一个,毫无价值。跟个人联系上的途径无外两个,一是实名认证,一是手机号码,在使用相关网站时绑定这两者的信息一定要谨慎。据我所知,目前用户量较大的知名网站中,只有 * 博在大规模的卖用户数据。如果说网站和 App 还可以防范一下的话,那通过通信运营商流出来的数据就真的无能为力了。通信运营商会记录你所有的浏览记录,包括打开了哪些网页、哪些 App、使用了多少时间等用户习惯数据,归类打标签,卖到外面。大数据公司买了通信运营商数据之后,会把这些标签和用户匹配起来,进行精准营销。如果你经常在手机上查一些男科医院,然后莫名收到男科医院的营销短信,请不要奇怪。万幸的是,某两家通信运营商并没有在总部层面加入贩卖数据的行列中,原因是嫌麻烦看不上这点利润,部分分公司自行开展,所以一些省份的用户数据暂时是安全的。但仅仅一家就卖出了 20% 左右用户的数据,想想也是难过。

技术无罪,但采用技术的人是不是有罪呢。我们谈到大数据的时候,都知道把海量的数据科学应用是人类进步的一个重要台阶。但在数据应用这个产业链上,从数据收集阶段开始就存在的一些非法的、擦边球的、没有对用户进行充分告知的收集手段,辅以以营销为目的的大数据公司(营销最容易变现),加上为这些大数据付钱的产业,形成了一个互相鼓励、狼狈为奸的闭环,最终导致我们在不知情的情况下泄露大量的敏感信息。

扫描二维码下载知乎日报

支持 iOS 和 Android
二维码下载知乎日报
阅读更多 为了重温《权力的游戏》,我来到你们的城市,走过你们来时的路 下载 「知乎日报」 客户端查看更多