招行周天虹:AI时代的分布式数据库
招商银行于1987年诞生在中国的最前沿——深圳,是中国第一家完全由企业法人持股的股份制商业银行。作为中国银行业数字化转型的先锋,招商银行近年来持续推进“轻型银行”战略转型,明确了金融科技银行定位,致力于打造一家深度科技化的银行。
招商银行开启“零售金融3.0”时代
招商银行是一家以零售为主的银行,在以银行卡服务为特征的“零售金融1.0”时代和以分层财富管理为特征的“零售金融2.0”时代都抢占了先机。今天,招商银行将率先开启“零售金融3.0”时代。 要实现“零售金融3.0”,主要要做好3件事:第一,将招商银行App打造成银行经营和服务的主平台。目前,招商银行App和掌上生活App的用户数超过1.2亿,月活跃用户(MAU)超过6000万。第二,打造“全产品、全渠道和全客群”的服务体系。第三,创造最佳客户体验。
一家先进的银行一定要走数据驱动的道路,无论是在营销获客,还是服务运营和风控上都是如此。招商银行在中国境内的130多座城市设有137家分行及1693家支行,服务的客户群数量过亿,其背后的支撑正是我们打造的数字化银行业务经营服务体系。
最近几年,随着深度神经网络算法的突破,人工智能(AI)迎来了诞生60年后的第一次爆发式发展,其在金融行业也有非常多的重要应用。例如:在图像识别领域,人脸识别可以用于解决金融服务场景中的客户核身问题,为客户带来很好的体验;自然语言处理可以让人和机器相互理解,被广泛应用于智能客服和智能助手方面,大大降低了客服和运营的成本。
金融行业是一个经营风险的行业,机器学习在金融风控方面正发挥着越来越重要的作用。在新技术的浪潮下,银行的IT基础设施也正在发生重要的变化,其中有3个板块显得越来越重要,即云计算、大数据和人工智能,其中后两者都是用于支撑对数据和信息的深度挖掘和利用。
招商银行在AI领域的探索和实践
招商银行在AI方面已经开展了一系列的积极探索与实践。
图像识别(Image Recognition)领域:2015年10月,招商银行推出了ATM“刷脸取款”功能,这是国内金融行业中应用人脸识别技术进行客户核身的第一个“落地”项目。
自然语言处理(Natural Language Processing)领域:海量的数据来自于互联网,其中大量有价值的信息是非结构化的文本信息,自然语言处理技术可以帮助我们有效地利用这些信息。招商银行通过分析在网络上发布的各类企业和政府的招/中标公告,解析其中的中标企业、中标项目和中标金额,已经成为银行对公业务商机发现的起点;与此类似,我们还通过分析网络上公布的法院判决书,解析出其中的原告、被告、涉案案由和判决结果,将其应用于对个人客户和企业客户的风险预警。
知识图谱(Knowledge Graph)领域:招商银行正在大力构建企业级的零售关系图谱和企业关系图谱,用来刻画各种复杂的关系,目前两个图谱已经覆盖了1.2亿个人节点和5000万企业客户节点。
智能问答(Intelligent Q&A)领域:这是自然语言处理和知识图谱两种技术的综合应用,目前招商银行已经在超过600个场景接入了智能问答系统。
机器学习(Machine Learning)领域:智能投顾和营销风控是金融行业机器学习的主战场。2016年,招商银行推出了国内银行业第一个智能投顾产品——摩羯智投,其业务规模目前已超过120亿元,服务客户接近20万,是国内银行业最大的智能投顾产品;而对于零售客户来说,每一笔交易都会接入我们的反欺诈平台,该平台部署了一系列复杂的规则和模型,但其平均处理时间只有50毫秒,实现了真正实时的智能反欺诈;此外,大型银行可以看成一个规模较大的经济体,涉及到大量的人/财/物资源的调度和配置,机器学习在预测规划方面可以发挥很好的作用,招商银行在这方面也进行了一些探索,例如网点客流预测、网点业务量预测以及ATM现金需求预测等。
AI技术和大数据技术正在快速融入银行技术体系,深刻改变着银行经营、服务和管理的方方面面,在AI技术和大数据技术的推动下,银行的传统经营模式将发生根本性变化,产生一种全新的数据驱动的轻型银行模式,而招商银行正在向这个方向持续努力。
携手华为,打造全球领先的分布式数据库
在数据驱动的发展趋势之下,技术上要求对海量数据进行非常高效的处理,因此一个可扩展、高性能的数据库就成为银行IT基础设施的关键支柱。
招商银行对一个先进的数据库有6个方面的要求:首先是高扩展,要能快速、弹性地应对业务量的变化;其次是高性能,满足金融场景中实时处理海量数据的需求;第三是高可用,满足银行信息系统业务连续性的高要求;第四是云架构,实现计算资源和存储资源的按需分配,通过云架构对庞大集群上的不同应用进行有效隔离以实现多租户;第五是易运维,数据库的规模越来越大,易运维能满足规模化运营和精细化管理的平衡;最后是易开发,在应用层面避免分库分表,让开发人员可以像使用集中数据库一样使用分布式数据库。
华为在数据库领域拥有领先的研发实践,也有意愿打造一款先进的数据库产品;而招商银行是数据库的重度用户,不但有需求、有场景,在数据库的开发和运维方面也积累了丰富的经验。2017年11月,两家企业携手成立了分布式数据库联合创新实验室,致力于打造一款全球领先的分布式数据库产品——GaussDB,包括4个方面的建设目标:
高性能企业级内核:要完整地支持分布式事务摄入,满足金融行业数据的要求,单机事务处理能力要达到每分钟百万级别。
支持分布式高扩展:要支持线性扩展,扩展比要大于0.8,要支持集群在线扩容,扩容时业务要实现零中断。
分布式高可用:单数据中心内,在PRO等于零的前提下要支持RTO达到秒级,同时要支持多数据中心、多副本和多活,实现故障的自动诊断、隔离和切换。
分布式云化:要支持计算与存储分离以及多租户。
目前,这款数据库产品已经发布了高性能企业级内核以及分布式高可用特征,招商银行也在两个重要业务系统上部署了该产品,并在生产环境中开始使用。未来,关于数据库的总体架构,招商银行主要有3个方面的思考:
首先,大力发展分布式数据库,结合数据库整体架构的转型,在数据库层面更好地支持业务发展。
第二,精简主力数据库的品种、精简数据库的技术栈,以方便开发和运维。
最后,利用AI和机器学习技术,持续构建高度自动化和智能化的数据库运维管理体系,以实现低成本和规模化的运维。
-------------------
本文转自《ICT新视界》第24期
原文链接:https://e.huawei.cn/cn/publications/cn/ict_insights/201809301120/case/201812251629
- 点赞
- 收藏
- 关注作者
评论(0)