阳光保险的资源服务化实践

百家 作者:QingCloud 2018-06-06 13:04:26


前言:本文为阳光保险集团信息中心基础架构处长杨波在青云QingCloud 保险沙龙上的技术分享整理而来。文中,杨波详细分享了阳光保险的 IT 基础设施选型、目前运维以及运营团队面临的问题,以及实现资源服务化的历程和多年积累的云计算实践经验,非常值得从业者借鉴与学习。



1

IT 创新与业务发展相互促进


关于阳光信息技术服务中心

信息技术服务中心隶属于阳光保险集团总部,主要负责集团、公司及下属子公司事业部系统自主开发及维护业务,目前设有北京、深圳和青岛三个研发中心,形成了 7 个二级部架构,员工总数超过 400 人。


从建立之初,信息技术服务中心就不断以科技创新推动业务发展,在 2011 年率先在保险行业中推出阳光“快易保”系统,实现保险行业的移动投保服务,使投保过程缩短到最快 15 分钟。


2013 年,随着公司各条业务线向互联网转型,移动官网和微信服务号应运而生。


2016 年创建了具有互联网电商水平的官网,并已上云。


2017 年,随着云计算、大数据、人工智能技术的发展成熟,以信息检索技术和机器学习技术为基础的“机智阳”客服机器人上线,该机器人回答问题的准确率在 70%-95% 之间,目前还在不断的提高。


信息技术服务中心以科技创新推动业务发展的同时,业务不断对 IT 提出更多更高的要求。


近些年来,集团发展较快,如客户体验、互联网保险、产品链、风险控制,甚至是海外业务拓展等行业热门方向,阳光保险都在积极尝试,这些业务动向推动着 IT 创新。


大数据已带来一场新的革命,未来无论想设计出更具竞争力、更科学的产品,还是事半功倍的选择最佳宣传渠道、销售渠道,都离不开大数据技术。


例如:设计差异化的车险,以吸引驾驶技术娴熟、事故率低的好司机,并在面对事故率高的司机时保护公司利益;为不同航空公司、不同航线设计差异化的延误险;选择性价比高的最佳宣传渠道和销售渠道等等。


区块链也是新兴技术,不仅改变了传统共享数据的方式和过程,并且有效防止数据被篡改或造假。目前阳光保险已有数个系统使用区块链技术实现登录认证。


无论是大数据还是区块链,底层都依托于云计算。云计算自上线以来,以其降本增效、资源共享、敏捷交付和弹性扩展等特点,已成为现在 IT 的基石之一。


近年来,阳光保险切实落实了云的建设和使用,目前超过 80% 的系统已经上云。


在第二个 10 年计划中,IT 部分是最关键的,是致力于各个业务系统升级换代的“新一代”项目,除部分关键数据库外,其他全部上云。



2

混合云是企业目前的第一选择


经过多年建设,阳光保险的基础设施已形成以通州和亦庄两个自建数据中心加上青云QingCloud 及其他公有云为基础的“两地三中心”混合云架构。


在这些资源规模达到一定程度后,如何保障服务效率并控制成本,获得需求方的认可,成为必须考虑的问题。我们认为资源服务化不仅可以提高工作效率,还可以为企业节约成本,其价值已被信息技术中心广泛接受。


数据来源于 RightScale 和工信部华信研究院


通过上图可以看到,在全球市场范围内,公有云占的比重超过其他云,互补的蓝色部分代表私有云。在中国市场内,私有云的比重超过其他云。


浅蓝色和深蓝色重叠在一起是混合云的部分,通过这些图可以看出,虽然存在差别,但无论在全球市场还是中国市场,混合云是企业的第一选择。


接下来说说保险行业的基础设施现状。保险行业在基础设施方面,云的情况主要有两种:


一是纯粹选择上公有云,他们的选择 AWS、QingCloud、阿里云等公有云服务商,这些云的管理和运维大多数是使用公有云提供的云资源管理平台;


二是作为国内主流的混合云选择,在公有云方面同样是 AWS、QingCloud、阿里云等。在混合云方面,机房内部包括 QingCloud、VMware、Citrix 加一些云管平台。


3

阳光保险的基础设施建设


阳光保险早期进行 IT 建设时,云还没普及,机房内有很多物理机资源。


云开始普及之后,首先上的是 Citrix 虚拟化,之后阳光保险选择 QingCloud 来建设了自己的私有云,同时选择阿里云和 QingCloud 作为公有云资源。


目前阳光保险正在构建统一的服务化平台,初衷包括两个:一是降低沟通成本,二是改善用户体验。


建设平台之初,我们思考为何建设这个平台,我们需要解决什么问题。由于基础设施种类非常多,我们总结了四个遇到的问题:


第一,沟通成本居高不下。


阳光内部是各部门、各产品独立核算,必须由需求部门发起资源申请。在传统模式下,基础资源分配权由运营部管理,需求部门在拿到资源之前,只能动嘴,不能动手。那么,事无巨细都要与运营部沟通完成。


同样,在运营部内部由于分工很细,各个环节之间要重复沟通同样的事务。比如今天做了这件事,明天另一个系统、另一个项目也要沟通同样的事。


第二,自动化程度低。


经过一段时间的自动化建设。虽然像资源分配、安装操作系统、安装定制化软件、配置监控和安全扫描等各项工作都已实现自动化。但各自动化模块只能完成特定功能,而没有形成完整的链条。这只是半自动化,而不是全自动。


第三,人员要求高。


由于每个资源有自己的管理平台,需要不同的人掌握多种平台的操作方式,而且,这样的人还要负责跟需求部门沟通。还要求这些人思考周全,并且具备良好的沟通能力。种种条件对人的要求太高,这样的全才是很难得的。


第四,服务质量难以保证。


人的能力、状态、心情以及各种意外情况等,都会影响服务质量。

   

最终,我们将需求归纳为以下四点:


  • 在异构多云情况下,能统一资源交付方式;


  • 同时满足公私混合等运营管理模式;


  • 满足企业级应用需求,符合企业内部管理方式;


  • 填补软件定义一切的最后一环,实现全方位数字化管理。


4

阳光云管功能梳理


在整理出需求后,我们梳理出对于阳光云管平台特性的需求:


第一,能够适应混合架构。


阳光内部有 Citrix 虚拟化管理平台、QingCloud 及其他公有云、还有物理机。对接这种资源,可以有效降低我们人员工作的复杂程度,清晰展示和统计管理所有资源,从而提高我们的工作效率。


第二,企业综合管理必须有流动审批和工单功能。


信息中心面对很多不同客户主体,有些客户主体不使用集团审批系统,云管平台必须包含审批功能,以便于必要时候使用。如果没有,以后有审计环节会比较难办。同样,工单系统对于工作量统计、跟踪、保障工作质量很有必要。


第三,综合数据处理,监控告警和报表统计是云管平台必备的功能。


所有云管平台都有这样的功能,因为没有监控告警和报表统计,谈不上量化和管理。在量化之上,资源使用优化建议、趋势分析和容量管理,则是基于数据深度运维。


据我们了解,根据 Right Scale 调查数据显示,30-45% 的云上资源会被浪费,对于公有云提供商来说浪费资源是没问题的,因为他们提供的每一种资源都是有回报的。


但是对于私有云来说,应该尽量减少这种浪费,因为降低浪费才能提高投入产出比,从而提高保险公司综合竞争能力。


第四,自助服务门户。


自助服务门户是要求模块化、可自主开发,它可以基于 IaaS 和 PaaS 资源服务,实现应用交付。


现在阳光内部在推运维转型,我们正在从传统运维向开发运维转型。我认为可自主二次开发是最重要的特性之一,也是我们选择青云云管平台作为服务平台基础的重要理由。


第五,综合计量计费。

我们要求可以自定义模型,可以使用阳光自己设立的计费模型。如果没有计费这一环,资源闭环管理便不能成为闭环。如果没有自动计量计费,我们在对接虚拟机和物理机时,就会仍然需要投入大量人力统计,并且投入大量精力跟用户沟通和解释。


第六,开放接口对接,开放接口是必须的条件。

如今,阳光像在座公司一样,已经有OA、监控、批处理等系统。如果不能对接这些系统,我们就会面对两难选择。是放弃以前已有的东西,全部迁到这个平台上?还是各做各的,不把这些系统整合在一起?


5

青云QingCloud 解决方案


在选择青云之前,我们调研了很多产品。调研后,我们认为青云的解决方案最适合阳光的需求。



以上是青云云管平台的各功能模块,模块分为几层,最底层是 QingCloud 私有云管理、物理机资源对接和公有云资源对接。


通过这些可以实现青云自己的私有云以及传统资源的纳管,同时可以通过云适配器来对接其他公有云的云管平台。


它不仅提供丰富的功能,而且具备二次开发、对接,以及良好的扩展性。



使用青云云管平台,无论是混合云+虚拟化的用户,或者没有虚拟化,只是公有云+私有云的普通用户,或者只是私有云用户,需要根据自身具体情况做定制化开发服务,都可以找到很好的解决方案。



青云云管平台可以实现多级组织机构、用户角色管理,可以自定义审批流程,实现精细化管理。以用户管理为例,青云云管平台的用户和青云云平台用户是两组不同的用户,他们是解耦合的。


假设我们有一名员工离职了,我们在云管平台上把用户删掉。底层云平台上的资源可以映射转移给另一位云管平台用户,实现连续性管理。



除了传统按租户统计管理资源外,还支持按业务系统维度进行管理。


在业务系统产品化背景下,可以清晰的看到产品的投入产出比。同时也可以在业务系统维度控制配额,实现更细粒度的资源隔离。提供操作审计模块,实现所有操作可追溯,满足内外部审计的需要。



除了对青云云平台做到服务进程级别的精细化管理外,还可以自动发现外接入的其他云平台或 VMware 虚拟化平台。


还有虚拟机的自动变更和自动发现,这种自动发现就是通过接口,对接 VMware、其他云平台的接口,对接上后可以定期按照我们设定的频率自动发现资源变化,这样就可以简化资源池和资产管理,保障数据的准确性。


青云云管平台还提供了大量 PaaS 服务,可以集成在青云架构中。最底层是硬件资源,中间是青云提供的大数据和容器等内置 PaaS 服务,加上可二次开发的 AppCenter2.0 ,形成青云 PaaS 层。最上层自服务门户和管理操作平台。


6

自服务平台开发实践


阳光在自服务平台开发的时间过程,为了尽可能贴合阳光内部客户的需求,并最大程度的实现敏捷、开放和自主可控的目标。


阳光除了部署青云云管平台外,还使用 Python Django web 框架,通过对接青云云管平台和 QingCloud API 接口,初步实现自己的自服务平台。


目前,该平台已经初见成效,实现了以下功能:


1、业务部门的资源申请和回收。


通过自服务平台,最终用户可以申请和释放 IaaS 和 PaaS 层的资源。后台会根据自服务平台页面的设置,对操作系统、用户以及软件环境进行相应配置,并自动完成监控平台和报警器的配置,自动计费。


2、对已有资源的软件安装。


可以在指定 IP 上安装指定软件,后台会在安装前根据预设的规则进行判断,避免损坏已有环境以及阳光自己定义的管理规范。


第三,可以进行简单的运维。


用户可以启停自己用过的资源。我们认为启停资源不会破坏环境本身,自主启停可以减少不必要的沟通,提高了响应速度,这个变化获得公司内部广泛好评。


第四,统计并展示用户自己拥有的资源。


可以统计并展示用户资源,以前用户做自己系统的汇报时,不太清楚自己可以运用多少资源。他们往往会发邮件问我们有多少资源,让我们给他提供清单。这在特定的月份(半年或年底)会占用我们过多的精力和时间,现在他们可以通过这个平台自己操作保存为 Excel,不需要再麻烦工作人员。


7

收益与未来规划


通过该自服务平台,我们获得的收益有以下几点:


第一,用户申请并获得释放资源的时间,从平均 1-2 天下降为平均 3-10 分钟,并且不再需要用户催办,改善了用户体验。


第二,我们资源室相关工作人员的工作强度大幅下降,由于过程中涉及到很多开发工作,促进我们从传统运维向开发运维的转型,部分人员技能提升明显,整个处室的工作氛围和思维方式均有明显改善,这促使我们从传统运维向开发运维的路上迈下坚实的一步。


我们的远期规划会继续扩展该平台功能,目前已计划以下功能:


第一,物理机统一管理。


之后我们会把物理机纳管到青云云管平台中。物理机的纳管是青云云管平台的亮点之一。


物理机的纳管是通过网络接入,纳管后可实现除上线外所有工作的远程完成,这样就会减少运维人员跑机房的次数。


第二,实现统一平台管理。


实现物理机、私有云以及公有云在内的统一管理的界面,这样就降低了对人员的要求,一组人就可以完成所有的操作,不需要在长假、或者重要节日时安排很多人值守平台。



获取更多云计算最佳实践、解决企业资源服务化问题、探寻企业数字化转型难题与经验。


这一切,尽在 Cloud Insight Conference 2018


7 月 27 日,青云QingCloud 将隆重召开 Cloud Insight Conference 2018 云计算峰会,大会设全体会议和 11 场专题论坛,届时将有超过 2,000 名来自政府及公共事业、大型企事业单位、互联网行业及企业服务领域的 CIO、CTO、架构师、工程师、开发者、技术爱好者及媒体记者齐聚北京国际饭店会议中心,共同探讨科技与创新的前沿话题,分享数字化转型实践经验,并见证青云QingCloud 年度战略与重磅展品发布。


让我们相约北京国际饭店 - 建国国际会议中心 ,点击“阅读原文”或扫码立即报名,一起洞见未来!


FIN -


关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接