巴曙松:监管科技在数据管理领域的应用与实践

随着金融大数据的蓬勃发展,金融监管过程中需要处理的数据量也急速膨胀,数据管理逐渐成为金融监管的重点和难点。

作者:巴曙松、陈泽田、朱元倩

来源:中国科大新金融研究中心

随着金融大数据的蓬勃发展,金融监管过程中需要处理的数据量也急速膨胀,数据管理逐渐成为金融监管的重点和难点。本文基于金融监管过程中面临的数据管理问题,着重介绍了监管科技在数据管理领域的应用场景与各国的实践案例,并对我国监管科技在数据管理领域的发展进行了展望。敬请阅读。

一直以来,金融机构作为信息中介,为金融市场参与者提供金融服务,缓解交易双方信息不对称问题。这一过程使金融机构积累了大量数据,麦肯锡的研究报告显示,从数据规模和应用潜力来看,金融行业无疑是大数据生产的主力行业。随着人工智能、区块链、云服务等新兴技术的快速发展和广泛应用,数据已逐渐成为金融企业最重要的无形资产之一。经济时代的重要特点之一是海量大数据。海量的数据为科技赋能金融行业提供了可能:对金融企业而言,数据是金融科技创新的逻辑起点;对监管机构而言,数据是监管科技的应用基础。只有足够多的数据供新兴技术使用,才能使技术更好地应用于特定的金融场景。数字经济时代的重要特点之一是海量大数据。

全球数据的增长速度之快前所未有,数据的类型也变得越来越多,对数据的管理与应用逐渐成为金融行业的热点和难点。金融大数据管理也为监管科技带来了机遇和挑战。有效的数据管理方案可以为监管科技提供更多的应用场景,从而简化金融监管环节,提高监管效率。但随着监管数据的边界逐渐模糊,监管过程中使用数据涉及的种类越来越丰富,包括结构化的表格数据和非结构化的网络内容,在一定程度上也加大了监管科技在数据管理上的难度。2019 年6 月的日本大阪的G20 峰会上,各国领导人呼吁制定全球科技规则,建立数据监督体系。监管科技在数据管理领域的应用也越来越受重视,各国监管科技在数据管理上的研发投入逐渐加大,数据管理体系日趋成熟。


一、监管科技在数据管理领域应用的背景


数据管理是指为了达到监管合规和企业战略目标,使用特定的技术,对数据的形态、内容和关系等层面进行规范管理,提升数据服务能力,以实现数据价值最大化的过程。如果将数据比作“原油”,那么数据管理,就是将“原油”加工成“汽油”的过程。数据管理使原始数据成为有价值的数据资产,为数据所有者的精准化经营和精细化管理提供强有力的武器和工具。

(一) 数据管理是金融科技创新与监管的逻辑起点

金融科技利用种类多样、结构复杂的金融数据,有效地获取、整合、存储、分析,并在分析中挖掘利用金融数据,为客户提供有价值且及时的增值服务。因此,有效的数据管理方案是成功实现一个可扩展、高性能的金融科技方案的基础。在金融科技高速发展的今天,建立基于支撑金融科技创新的数据管理体系,实施有效的数据管理,是金融企业提升自身核心竞争力的关键。

在金融科技的重要分支监管科技中,数据管理亦是核心环节。一方面,数据的存储效率不仅代表从数据生成到收集的时间间隔,还影响监管机构将数据转化为报告和决策的能力。另一方面,数据的质量还决定数据的有效性。为了防止“无用输入,无用输出”的问题,监管机构必须对数据进行验证检查和其他质量控制,否则就不能保证数据提供的信息真实可靠。因此,有效的数据管理对监管科技的使用至关重要。

(二) 监管科技应用于数据管理可以推动数据资产化进程

目前,随着企业对于大数据的依赖程度越来越高,数据带来的经济效益价值也在不断凸显,数据要素逐渐成为企业的无形资产。然而,数据资产化进程并非一蹴而就,还有很长的道路要走。监管科技应用于数据管理领域向市场传递了一个信号,即明确了数据在数字监管领域的重要地位。这一信号指引企业更加重视数据要素,以及提升数据管理对数据要素价值的释放作用,有助于推动数据资产化进程。

于企业而言,数据作为一种新型生产要素,具有乘数效应。数据可以放大劳动力、资本等生产要素在企业和行业价值链流转中产生的价值。于监管当局而言,数据要素将推动监管从“业务驱动”向“数据驱动”转型,提升监管现代化水平。数据赋能监管科技,为监管科技提供底层数据支持;监管科技反作用于数据,在应用过程中不断释放底层数据的价值,促进现代监管技术的市场化应用。二者相辅相成,相互作用,共同推动整个数字金融产业形成和发展,进而加速数字经济新业态、新模式和新优势的诞生。


二、金融监管中数据管理面临的重要挑战


近年来,随着金融科技的发展,金融数据急速膨胀,监管机构在这愈演愈烈的数字化浪潮中难免面临监管挑战。过去监管机构面临的挑战主要是如何收集受监管实体的行为数据,而现在的问题是如何去处理并管理这些海量数据,通过分析数据获取有用的信息,从而做出更有价值的决定。尽管监管科技的发展使数据管理手段更加丰富,但金融监管在数据管理上还是存在以下几点挑战:

(一) 数据确权困难是搭建金融数据监管体系的最大障碍

不仅仅是监管机构,任何机构和实体将数据变成资产之前,需要先摸清数据归属,否则数据资产化将无从谈起。然而,数据作为一种虚拟物品,其权属不同于传统物权可以被直接支配。数据在经济和社会活动中自然产生,可以多主体使用,且不会被消耗。数据权在数据的全生命周期中有不同的支配主体,其所有权并不一定完全属于某个经济主体,有时甚至很难定义出归属主体。

随着数字经济日益蓬勃发展,数据权属生成过程愈加复杂多变。以金融监管过程中的信息保护为例,如果个人金融信息归属于个人,那么通过数据的分析、加工、处理得到的信息属不属于个人金融信息?在数据归属得到清楚的界定之前,从全球范围来看,数据确权定价问题均是巨大挑战,数据所有权、使用权、管理权、交易权等权益没有被相关的法律充分认同、明确界定和完全保护。

(二) 保障数据安全是开展宏观审慎管理的底线

数据要素区别于传统要素资源的特点是虚拟化的数据要素更易泄露,数据安全和隐私保护的要求空前提高。根据数据泄露水平指数(Breach Level Index)监测,自2013 年以来全球数据泄露高达130 亿条,其中很多都是由于管理制度不完善造成的。而据威瑞森《数据泄露调查报告》显示,2019 年全球86 个国家共发生41686 起安全事件和2013 起数据泄露, 使得相关机构蒙受巨大损失。此外, IBM《2019 年全球数据泄露成本报告》显示,近5 年来数据泄露的年平均成本已达392 万美元。

出于监管的目的,监管机构需要掌握金融实体大量交易信息,是金融市场的数据中枢。一旦发生数据安全问题,将会导致市场失灵。因此,监管当局在与金融实体共享和传输数据的时候,需要考虑一系列数据安全问题。例如,哪些数据明确不可共享或交易?哪些信息出于“安全”或“隐私”等重要考虑,必须以加密或其他形式进行保护,否则不得用于共享或交换?只有明确信息安全和隐私保护方面的边界认定,聚焦在信息安全和隐私保护方面的监管框架,监管当局才能更高效、更安全地开展数据管理工作。

(三) 提升数据质量是保证监管有效性的抓手

数据的数量与数据质量并没有直接的联系,数据量越大并不意味着可使用的数据一定越多。对于金融行业而言,只有可控制、可量化、可记录、可共享、可服务、可变现的数据才是高质量、有价值的数据,低质量的数据甚至错误的数据将引起“无用输入,无用输出”问题。但对数据质量的控制不仅需要避免操作失误,还涉及对数据的识别,因此在实际操作中存在很大的困难。

由于监管机构身负宏观审慎管理和微观审慎监管双重职责,错误信息导致的错误决策的调整成本巨大,因此监管科技对数据质量的要求更高。监管科技对数据质量的控制可以说贯穿数据管理的全过程,在数据获取阶段保证数据的完整性和格式的正确性,在数据加工阶段保证数据内容的合理性和可用性,在数据调用传输阶段保证数据接口的匹配性等。其中,数据验证技术是监管科技保证数据质量的核心技术。

(四) 强化数据分析能力是数据管理的核心目标

数据管理是数据分析工作的先导环节,无效的数据管理体系很容易造成数据分析失效,即“无用输入,无用输出”问题。但归根结底,数据管理工作是为后续的数据分析工作服务的,因此,搭建数据管理体系应该以更好地服务数据分析工作为核心目标。

然而,在过去的金融监管操作过程中,数据管理和数据分析工作的脱节较为严重,往往是数据管理部门在收到数据分析部门数据请求之后,调取所需数据后再发送给数据分析部门,少有监管机构能够做到一体化操作。在这种模式下,每一次的数据调取都相当于一次新的操作,这样不仅加大了数据管理环节的工作量,更造成了资源和存储空间的浪费。

三、监管科技在数据管理中的应用场景


按照各个环节所实现的功能,数据管理可以划分为数据存储、数据传输、数据验证、数据整合和数据可视化五个细分领域。不同领域里的数据管理工作侧重点不同,并没有主次之分,但由于不同领域的技术成熟度存在差异,监管科技的应用程度也有所不同。

(一) 数据存储

数据存储是数据管理的起点,数据管理往往需要对同一数据进行多次使用。因此,需要为数据设计存储基础设施,通行的方案是建立数据库。但对于如何划分数据,或者说如何对数据库进行分类,并没有一个统一的标准。尽管在大多数数据管理方案中,管理者倾向于按照特定功能建立多个数据库,但学界认为,最好的数据库需要从业务策略开始设计,而不是从单个应用程序和特定功能开始。纵观国际上监管科技的实践情况,建立通行数据库是比较成熟的做法[1]。从监管机构的监管战略出发,根据所需和期望的数据范围、质量、结构和可用性来划定数据存入标准,在此基础上,可以创建质量保证机制来提高数据的准确性和精密度。基于这种方法,可以得到一个数据集,这个数据集就是通行数据库。使用者可以根据管理需求和用户访问模板对通行数据库进行二次建模。通行数据库可以从根本上改变监管者的数据管理方法,使其朝着更精简、更高效的数据基础设施方向发展。

(二) 数据传输

数据传输指的是数据在不同数据源或存储设备之间的传递,目前国际上较为成熟的数据传输方案主要有三个: 一是应用程序编程接口(以下简称API)。API 是一个应用程序如何与另一个应用程序交互的协议集,通常用于促进数据交换。二是基于云计算的数据传输方案。云计算是一种高效和可扩展的数据存储解决方案,可以实现TB 量级的大数据传输。三是分布式账本技术(以下简称DLT)。DLT 允许通过一种一致的算法进行自动验证,该算法在不同地点复制、共享和同步数字数据。

从各国的监管科技实践经验来看,基于云计算的传输对基础设施要求严格,分布式账本的传输效率较低,API 作为数据传输介质的应用最为广泛。API可以在没有人工干预的情况下直接在数据库之间传输大量数据,从而克服了通过电子邮件或网页传输文件的大小限制,并减少了耗时和容易出错的手工提交。

(三) 数据验证

数据验证是指按照报告规则对格式和计算的完整性、正确性和一致性进行质量控制检查。一般来说,自动数据验证检查包括:数据接收检查、数据完整性检查、数据正确性检查、合理性检查和一致性检查。这些检查提高了分析数据的效率,节省了管理者的决策时间,使数据使用者能够更专注于挖掘数据的潜在价值。随着大数据时代的到来,数据验证已不再是数据管理的难点所在,应用机器学习(以下简称ML) 的数据验证模型可以较好地完成这项任务。只要提供足够多的数据样本供模型训练,机器学习尤其是深度学习(以下简称DL) 模型可以自动地识别异常数据,将其标记为统计过程或数据提供源的潜在错误。

数据验证在各国监管科技中使用较为广泛。例如,新加坡金融管理局使用数据验证技术,包括数据清洗和数据质量检查;奥地利国民银行开发了一个基于ML和非监督学习的数据验证模型,用来去除错误的数据。

(四) 数据整合

数据整合涉及以不同格式的数据集成,这些数据一般来自多个数据集。不同的数据集通常包含关于同一主题的不同维度的相关信息(如公司、个人),但由于存在数据接口不一致等问题,将它们集成起来可能非常麻烦。尤其是当不同的数据集之间没有可用的唯一标识符(键值) 时,传统的数据整合方法几乎无法使用。使用ML方法可以有效地解决这个问题,ML算法依据数据的概率分布来匹配数据集,以此来整合不同的数据库。

数据整合是很多监管科技应用程序的重要组成部分。监管科技应用程序能够结合多个数据源来支持分析工作,这通常涉及连接结构化数据和非结构化数据;意大利银行将可疑交易报告(结构化数据)与新闻评论(非结构化数据) 结合起来,用于反洗钱监测;卢旺达国家银行将监管数据与来自内部系统的数据相结合,为监管者和决策者提供有意义的信息[2]。

(五) 数据可视化

数据可视化模块指的是位于大数据架构之上的接口,这些接口以最小的延迟提供无缝交互的用户体验。它们常常代替需要手动更新的静态电子表格生成的仪表板。为了从数据中提取最有意义和可操作的信息,大数据仪表板允许进行大量的分析操作,例如向上钻取(在一个维度上总结数据) 和向下钻取(沿一个维度更深入地挖掘数据),以及跨多个维度对数据进行切片、分割、转置和覆盖。

许多监管机构需要应用数据可视化技术。毕竟数据不等于信息,考虑到数据的数量、密度和复杂性,需要强大的可视化工具以一种容易理解的方式向监管者提供信息。例如新加坡金融管理局开发的监督仪表板,它简化了数据使用的体验,并为监管者提供对其投资组合中金融机构健康状况的“一目了然”的可见性;澳大利亚证券投资委员会使用iBase 程序来表示结构化数据源的时间、关联和因果关系;荷兰中央银行投入大量精力将数据输出转换成逻辑指标,如自行开发的动态网络可视化。


四、监管科技在数据管理领域的应用案例


有效的数据管理体系是监管机构开展数据分析工作的依托,监管科技的注入则大大缓解了金融监管中面临的数据管理难题,使监管当局可以更高效地利用数据进行决策。因此,各国监管机构纷纷探索监管科技在数据管理领域,尤其是上述五个场景的实际应用程序或实施方案。

(一) 欧洲中央银行的分析信用数据集项目

分析信用数据集(AnaCredit) 是欧洲中央银行为银行体系建立的一个标准的通用数据库,里面存放了欧元区所有成员国各个银行贷款的详细信息,包括贷款人、借款人和贷款协议等。该数据库支持多种中央银行职能,包括货币政策决策和宏观审慎管理等[3]。

欧洲中央银行于2011 年与欧元区和一些非欧元区国家中央银行一起启动了该项目,于2016 年6 月1日发布了《AnaCredit 法规》的最终版本。该项目计划分三个阶段实施:第一阶段,在2018 年9 月之前,信用机构向其所在国中央银行提供贷款金额在2.5 万欧元以上贷款信息;第二阶段,2018 年9 月开始,汇总欧洲中央银行监管下的重要机构的信息,为欧洲中央银行系统建立共享数据库;第三阶段(计划于2020 年底),将开始收集有关家庭抵押贷款和个人业主信贷的匿名信息。由于该数据库的数据具有统一的结构和数据标准,AnaCredit 可以对这些数据进行分析和比较,这是以前的汇总数据无法实现的。

一方面,AnaCredit 将信贷数据细化至企业。由于中小企业是欧洲经济的主要参与者,因此有关中小企业的信贷信息对于货币决策非常重要。过去,有关企业的信贷可用性必须通过某些调查获得,而现在,AnaCredit 可直接提供这些详细数据。不仅如此,AnaCredit 收集的详细数据还可以用于评估这类公司的债务可持续性。另一方面,AnaCredit 将风险数据细化至部门或地区。例如,如果某个成员国的银行体系没有很好地分散,并且过度暴露于特定地区或行业,那么AnaCredit 可以突出显示这一点,并能够对部门或地区的信用风险及其潜在风险进行更准确的识别,预防系统性风险的产生。

AnaCredit 是欧洲中央银行数据战略的重要组成部分。欧洲中央银行统计职能也在金融业的参与下,正在设计和实施一种协调的数据管理,包括在不同的统计和法律框架下收集的信息,以简化数据报告并减轻报告人的负担。以AnaCredit 为中心,欧洲中央银行还提出了两项倡议:一是欧洲报告框架,该项目旨在收集不同统计目的所需的所有数据,并在所有国家以综合和协调的方式进行银行监督;二是银行综合报告词典,它描述了银行需要向当局报告的输入信息的可能模型,以及生成这些报告所需的转换规则。这两项倡议的目的是向金融机构提供一个综合框架,以减轻金融机构的合规压力。

(二) 澳大利亚的通用数据结构SBR

澳大利亚监管当局规定金融企业在提交监管报告时,采用标准业务报告(以下简称SBR) 这一通用数据结构。SBR 报告由多个监管机构合作设计,由监管机构定义报告中的字段名,通过这些字段名能够访问特定的数据[4]。最早采用SBR 作为通用数据结构的国家是荷兰,但是在澳大利亚,SBR 计划实现了扩展,包括通过共享政府中心提交数据的统一流程和渠道(见图1)。

图1:澳大利亚SBR模式

从2008 年开始,澳大利亚政府开始对其监管机构从行业收集的信息采用统一的标准化数据结构。2010 年,政府发布了第一个版本的综合分类,即数据字段列表,涵盖了澳大利亚公司向多个监管机构提交的报告。与此同时,政府与澳大利亚软件行业合作,鼓励科技公司使用这些数据字段来构建软件,以实现自动化合规。此外,澳大利亚政府还调整了法规,使报告过程以数据为中心。

SBR通用数据结构降低了企业的合规成本,被监管机构使用SBR 可以同时满足多个监管报告要求。据澳大利亚税务局估计,澳大利亚的SBR 计划在2015—2016 年为政府和企业节省了11 亿澳元的合规成本。同时,SBR 减少或消除了重复的报告,提高了监管效率。目前,澳大利亚的软件供应商仍在积极开发标准化的数据结构,以构建新的合规解决方案。对澳大利亚来说,通用数据结构只是监管科技在数据管理领域的开始,但这些在法规、技术和数据方面的协调方案实现了真正的监管科技转型。

(三) 新加坡的开放金融行业API

新加坡致力于打造“API 经济”,新加坡金融管理局于2017 年宣布开放金融行业API。注册的金融机构可以使用新加坡金融管理局提供的API 接口,对行业内绝大部分数据进行查询,如金融产品的详细信息、检索指定账户的交易记录等。图2 展示了新加坡金融管理局对候选API 的筛选过程,新加坡金融管理局使用已建立的框架和行业参数对5600 多个交易行为进行了评估,经过700 多个业务流程,创建了411个候选API 的推荐列表。为了便于理解和使用,候选API 进一步按照它们所代表的实体、业务类型或者提供者进行了分类。进一步地,新加坡金融管理局按分阶段推行的原则,将这些服务种类分类,为金融服务业及跨界别提供全面的评估及涵盖范围。经过筛选之后,监管机构和银行成为API 最大的提供者。由于新加坡金融管理局对监管报告和信息公开的重视,行业内绝大部分的API 由新加坡金融管理局提供。对于银行来说,它们业务的广度和大量的业务流程帮助它们成为行业内第二大API 提供商。

图2:MAS对候选API的筛选过程

开放API 的创建提供了一个可持续的宏观环境,促进利益相关者之间的良性竞争与相互合作。从根本上说,围绕API 构建的生态系统的核心优势是行业参与者之间的协作和共同创造的便利性。企业可以免费通过API 从中获取相关数据,因为将现有流程转换为支持API 的格式的成本很低,这样公司就可以访问和创造性地利用数据,为客户提供价值和利益,这些便利极大地促进新想法和创新解决方案的产生。通过采用开放API,传统金融机构可以更容易地试验、协调和利用金融生态系统中其他参与者开发的创新解决方案和业务模型。

(四) 奥地利国民银行的数据验证机制

奥地利国民银行开发了一个数据转换平台,用来连接被监管实体与监管机构的IT 系统。该系统可以对数据进行自动验证,不会增加数据提供者的管理负担。具体来说,数据平台允许银行部门直接上传奥地利国民银行要求的合规信息,但无须提前进行数据验证。

数据转换平台由奥地利报告服务公司(以下简称AuRep) 维护,该公司成立于2014 年,由7 家最大的奥地利银行集团共同拥有。银行将数据输入AuRep的基本数据库,然后,一组连续的标准化转换规则将自动对基本数据空间中的数据进行验证,并转换为可以“推”到奥地利国民银行的数据,转换后的数据称为Cube (数据立方体),见图3。

图3:数据转换平台运行机制

在数据转换平台中,从基本数据库传来的数据将进行自动验证,验证过程如图4 所示,分为识别分析、数据评分、输出结果三个过程。识别分析对传入数据进行数据分割和分类,为数据加上类别标签,方便后续数据准确性验证,主要分为两个部分:奥地利银行业务分析模型为主的基本识别和包含文本识别的细节识别。数据评分是应用众多关键模型(见图5) 对识别之后的数据进行定性与定量评分,用以估计数据的错误概率。定量分析对应的输出结果为数据评分,定性分析则输出针对文本的一些验证结果,例如,对包含违规操作的数据发出预警信号。

图4:自动验证的一般过程

图5:数据评分过程中的部分关键模型

AuRep 的数据转换平台覆盖了大约90%的奥地利银行市场的资产负债表总额以及信贷机构的数量[5]。奥地利国民银行报告数据模型中指定的所有报告都通过AuRep 运行。根据奥地利国民银行的使用经验,该平台的数据验证机制容错率较高,系统运行稳定。目前,几乎所有的统计和金融稳定报告以及部分监管报告都是基于这个数据模型运行的。这种方法不仅提供了规模经济,而且允许金融行业的风险分担。

(五) 卢旺达国家银行的电子数据仓库

卢旺达从2008 年起实行全国范围的普惠金融政策, 2009 年末已成立了400 多家储蓄和信用合作社(以下简称SACCO)。SACCO和其他小额信贷机构服务的人数几乎与整个银行业服务的人数相同。到2010 年,移动数据运营商也开始提供金融服务,卢旺达国家银行也不得不大幅扩大其监管任务范围,以涵盖新的金融机构。但各金融机构之间的数据存储在各自的系统中,如何对来自不同数据集的数据进行整合成为首要难题。

为克服这个难题,卢旺达国家银行与Sunoida Solutions合作开发了一个电子数据仓库(以下简称EDW) 系统。卢旺达国家银行使用EDW可以直接从600 多家受监管的金融机构的IT 系统中“提取”数据,这些金融机构包括商业银行、保险公司、小额信贷机构、养老基金、外汇管理局、电信运营商和转账运营商。这些机构每24 小时甚至每15 分钟就会自动提交数据,对于移动货币和转账运营商来说更是如此。

EDW编制了一个数据字典,并要求每个金融机构编写数据脚本,将数据字典映射到其本系统的信息。这个过程只在最开始执行,之后EDW系统将自动对系统接口进行维护,这大大提高了EDW的运行效率。然后,EDW会将映射的信息放入一个“准备区域”,卢旺达国家银行可以从中提取它需要的信息(见图6)。加密的数据通过VPN通道并通过数据完整性检查机制运行。通过这种方式,EDW向卢旺达国家银行提供及时、一致和可靠的数据。

图6:EDW的数据整合过程

EDW系统还提供数据验证机制,大大提高了金融机构的数据质量,金融机构现在也将这些数据用于内部风险管理。EDW减少了数据的输入错误和数据之间的不一致性。卢旺达国家银行在系统中建立了质量和完整性规则,如果数据不符合某些标准,就会被拒绝,并向卢旺达国家银行和监管机构内的银行审查员发送自动电子邮件警告。此外,来自数据供应端的历史数据清理目前正在进行中。

除了提高数据质量,EDW还具有灵活性和快速分析大量数据的能力。卢旺达国家银行可以调整其监督流程和方法,以充分利用收集的数据并更有效地分配监督资源。由于外部利益相关者的数据差异,卢旺达国家银行并没有完全结束手动报告。卢旺达国家银行还简化了内部业务流程,以确保完全捕获信息。

(六) 荷兰中央银行的动态网络可视化

荷兰中央银行用自行开发的动态网络可视化来监控欧洲TARGET2 银行间支付系统中荷兰部分的所有支付交易。在该网络中,银行及其支付交易分别用黄结点和青色边表示(见图7)。连续几天的可视化显示了每日网络的动态变化。可视化网络采用的是ForceAtlas2 布局,这是一种用于方便网络可视化的连续图形布局算法。因此,随着时间的变化,网络中节点的位置将被不断地重新计算。银行标签和方向的边缘已被省略,以确保机密性。

图7:荷兰中央银行使用网络关系图动态监控银行间交易

根据网络布局,交易活跃的银行在网络中心,不活跃的银行处于网络边缘,根据空间位置对监控实体的行为形成基本认知[6]。对于内部分析,显示银行名称、交易量和边缘方向,使监管者能够观测有关个别银行行为的问题:在一天中的任何特定时刻的交易对象是谁,交易是单向还是双向,交易价值是什么等等。

网络图的底部显示了一个带有滑动选择标记的时间轴,时间窗口和加载的速度都可以改变。时间轴还显示了全天活跃的银行数量的折线图。该可视化用例可在三个不同层面监控银行间交易市场。首先,动态网络可以帮助确定市场宏观结构的任何变化。就活跃银行的数量和它们的连接性而言,判断网络是稳定的还是正在分裂成子集团,可以为监管者是否做进一步的调查决策提供帮助。其次,在微观层面上,监管者可以跟踪单个银行单日、一周或任何其他时间间隔的时间轴,重点关注这家银行的交易,并在网络中识别它的交易对象。最后,监管者可以使用动画进行比较,评估相同的支付系统在不同时刻的变化,或者不同类型的支付系统在特定时刻的差异。

图像检查能够识别市场活动的瞬时的、微观的方面,通过观察银行之间的联系模式,监管者可以了解到正常的市场活动情况。与静态可视化相比,动画提供了更多的视觉线索,为监管者展现一段时间内的市场变化。


五、展望与经验总结


在大数据时代,监管机构在构建集数据收集、转换与计算分析于一体的数据生态体系的同时,还需要加强对数据的管理。高效率的数据管理和数据运营不仅能降低数据开发成本,还提高了监管科技的适用性,为监管机构决策提供更好的数据化支撑。

展望未来,监管科技在数据管理上还有许多发展障碍需要解决:一是传输效率,尽管API 传输的可拓展性强,能够处理当前监管科技所需的数据量,但API 传输具有承载上限,随着大数据时代的进一步发展,TB 量级以上的数据量将成为主流,届时基于API 的数据传输效率将大大降低,新的传输技术有待开发。二是数据安全,现行的数据加密技术的稳定性仍存疑,监管科技使用的数据涉及大量受监管机构的关键信息。这些数据如果泄露将造成非公平竞争,影响行业秩序,甚至引起金融风险。在监管科技发展的同时,这些障碍都需要得到解决,只有协调推进底层技术和相关法律的升级,才能使监管科技发挥出更强大的作用。从全球监管科技在数据管理领域的应用来看,我国运用监管科技改变金融数据管理现状也大有可为:

一是要强化监管数据管理的顶层设计。在监管大数据时代,监管当局不仅是金融数据的生成者、收集者、储存者和使用者,也会逐渐成为商用金融数据的经济受益者。无论是数据安全保护,还是数据共享模式、交易方式,都需要政府出台清晰和包容性高的规则和指引,按市场化原则统一管理金融数据市场。搭建监管数据管理体系时,监管当局需要界定不能共享和交易的数据边界,设置数据安全和隐私保护方面的标准和要求,为监管科技使用和应用程序设计奠定良好的制度基础。

二是推动建立数据管理各领域的行业标准,包括但不限于数据格式、数据传输方式、数据使用权的交换准则。行业标准的建立不仅可以对监管科技的应用范围和运作模式等标准进行规范,还可以引导整个行业未来的健康发展,促进金融科技在数据管理领域的创新。尽管行业的最终标准一定来自市场的选择,但监管当局在其中需要发挥推手的作用。前瞻性的顶层设计会使市场自动地调节行业生态。三是要协调监管机构内各部门的联动,建立“数据收集—数据管理—数据分析—制定决策”一体化的数据监管体系。以数据驱动为核心的监管科技服务于金融监管这一职能,因此数据管理不能割裂于数据分析和数据收集,必须建立完整的数据监管体系,让数据更好地支持监管决策。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论