CA中国资深技术顾问余建源
大家下午好!
真的很荣幸能有机会在这里跟大家交流一下在税务系统运维阶段一些应用性能和管理难题。我本身是CA的做应用系统方面的技术顾问,我叫余建源。
CA公司其实是全球最大的IT软件供应商,在全球前500强的客户当中,有99%都是CA的客户。CA在中国一直是非常关注我们的客户,在去年向中国追加了1千万美金的投入,同时也增加了我们在中国的研发团队的人数。另外,传统的销售模式上,从分销到直销,通过转变变成了100%的渠道模式,向广大的客户提供一个增值的业务方案。
我们CA主要推的概念就是转化IT管理,就是企业IT管理的概念,简称EITM.EITM的核心就是用统一而简化的方法,而管理我们的IT、信息,以及对IT做一个安全的保护。
围绕着EITM的解决方案,我们有六大部分。首先是安全和风险的管理。一般来说,安全和风险管理讲的是身份的管理、我们主机的加固、数据的丢失保护等等。另外一个方面是我今天要讲的,就是应用性能管理,这是跟我们的税务信息部门的运维切身相关的一个课题。还有是IT运维的自动化,还有项目的组合管理,还有IT服务管理,再有是数据备份。
其实我们税务部门做的信息化的努力,它的成效已经讲得非常多,我也不在这里一一细述。但是从上面的PPT所讲的,从我们最终的用户反馈回来的评价可以知道,其实IT建设真的是大大地提高了我们的效率,同时也保证了国家的收入稳定。
但是,这种信息化的建设,给我们带来了一个我们税务的业务部门、信息部门,跟纳税者、纳税企业,还有其他的单位,比如说银行等等,他所带来的关系其实有一个变化。比如说以前我们用的系统还不是网上的系统的时候,以前我们的接口部门就是业务部门,所有的纳税人、纳税企业,都是跟业务部门去做沟通和交流、做业务。然后,我们的信息部门仅仅面对着的是业务部门,然后是我们的系统。
但是当信息化扩展,然后我们的网络在建设当时了现在的高度以后,其实我们现在很多的业务是通过互联网的系统去完成的。那么,我们这个系统变成了我们的纳税企业直接通过网上的系统去做报税,填我们的税单,查发票等等各种各样的业务,都是直接通过这个系统。那么,这个系统的运维方就是信息部门。所以,我们现在税务的信息部门,其实它的关系是说,它面临着非常大的压力,面临着非常多的客户。它现在是直接就变成了业务的一个接口。
正是这些应用的上线,这种系统的建设,我们其实已经做了一个非常大的努力,就是做网管。我们有一个非常好的网管的平台,其实在不同的税务的部门,它已经上了我们的网络,已经监控了我们网络的可用性,我们的主机,我们的数据库、中间件,甚至机房环境、其他部门,我们其实都有一个比较完善的监控。而且,我们每次的服务报表,像这些系统的可用率,你可以看到都是非常高的,99%、99.9%.但是,这个系统为什么没有人去监控用户体验呢?这些系统的综合加在一起,才能向我们最终的客户提供一个完整的服务。我们为我们的纳税人提供的,其实是一个服务。那么,这个服务到底怎么样呢?其实这个观点在我们全球的案例,客户都觉得是比较欠缺的。
主体上,比如说举个例子,假如我们这个系统出了性能问题,比如说慢,那么我们的业务部门最想知道的是哪些用户没有办法报税,性能不好到底有多不好,它的成功率到底有多少。比如说我们的信息部门、运维部门知道这个问题吗?这个问题发生了多久?这些问题都是比较难做的,最难做的是我上了这么多的监控系统,那为什么客户还是说很慢,这个慢到底是什么概念呢?
当问题到了我们的信息部门的时候,我们的信息部门觉得这个问题到底是一个个案还是一个普遍的现象?因为我们运维的人手,在很多的企业当中,其实都是非常地珍贵、比较少的。我们要投入的话,我们到底是去解决哪一个问题,我们能不能很快地解决这些问题,从而让这个服务重新恢复它的正常,让更多的纳税人、纳税企业可以得到一个比较好的服务的效果?这是他们觉得比较难定位的问题。
为什么这么难呢?其实,我们之前做的网管,都是针对上面这张图上面大家可以看得到的一个一个点做的监控。但是,现在的业务是不一样的,现在的业务我们必须要清楚地知道,比如说做一个提交,这个数据流穿过了很多的架构,然后穿过了很多的系统,回来才告诉你办税成功。那么,这种交易我们怎么样监控?客户说的这种慢,是说的是交易的慢,而不是说你系统性能不够好,是一种总体的说法。CA Wily就是有应用性能管理的最佳实践,可以帮大家在运维方面有一个思路。
最佳实践其实有三个部分,第一个部分也是最关键的部分,就是说它不是从网管的角度,它是从用户的角度去了解我们的服务水平,清晰地知道我们的水平达到了一个什么量化的衡量。然后,根据用户的感受,再去了解、判断我们的系统问题,比如说这个纳税人说慢,我可以查到,原来这个慢是跟系统、网络、应用相关,能够具体地定位到位置所在,这是CA的做法。
最佳的实践第一个阶段,就是第一你必须要监控所有的税务交易的响应时间,这是我们最佳时间的一个首要的基础,就是所有的增值业务都能够监控。
当监控了所有的业务以后,我们就可以有一个总体的视野,把我们的服务水平从一个没有数据的阶段,变成一个量化的阶段,到底我们的服务水平到了什么样的程度,这是可以量化的。我们的图中是一个例子,这是一个税务网站的交易的统计,如说我统计了一天内的业务,比如说发票的真伪查询、抽奖登记、打开首页等等的交易,它的成功率。有了这个成功率以后,我们这个客户很清晰地知道,原来我所提供的服务,最差的就是只有30%成功率真伪查询的交易。他非常清楚,原来我每一个客户用这个交易,需要用到2分钟的时间,就是点一个按纽2分钟才知道,这就是量化的数据,它很清晰。那么,知道了最严重的问题所在,他还可以知道,到底这些慢的问题影响了谁。可能是我们的纳税大户,我们可以知道到底是谁受到了这个影响,我们可以为这个用户提供一些额外的处理,这是对于客户的监控。
当你知道了总体的状况以后,我们就可以做预警。比如说当我发现我这种服务下面的系统,是处于一种亚健康状态的时候,其实我们已经可以做所谓的预警。预警的作用是说,希望可以通过预警让这些服务的性能不好的时间,达到一个最小化。就是尽量让我们的纳税人、纳税的企业,用这个系统不觉得它有一些问题,都是很顺畅的。那么,这就是主动式的预警,让这个问题最小化。
另外,当你舰空导这些交易水平,你怎么知道我有一些交易,我可能有若干个子系统、若干个交易,都是需要优化、性能都是不好的时候,但是我人手并不是很充裕的时候,怎么办呢?我们就要做一个所谓的优先级,所谓事有轻重缓急,那么哪些事才是最重要的呢?比如说这个交易影响了我们很多的纳税大户、很多的纳税大省,或者是这个交易可能是一些报税、纳税的交易,我查发票相对优先级低一点点。可能我只是慢,这可能是严重的程度低一点,根据严重的程度决定我们的对于事件的处理,这是所谓的资源优化,就是用最快的时间干最大的事情的方法论。这也是一个网站的例子,就是发现有1万多名的交易,也是真伪查询提交的时候,它出现响应慢的问题,它可以非常清晰地知道什么时候发生的,持续了多久的时间,这都是非常清晰的。
我们有一个总体的量化网络,当我们发现问题,我们就要定位问题,我们怎么样定位这个问题?比如说像这个交易,这是跟税易通做交易的时候,发现交易缓慢,那么怎么知道缓慢呢?就是我们CA的工具可以深入地定位分析及可以定义到应用代码级的定位的能力,可以通过这种工具帮助你的运维人员、管理人员深入定位问题所在。
定位其实有两个层面,一个是专家型的,一个是所谓的非专家型的。非专家型的是希望让值班的人员比较快速地知道问题的所在,加快问题解决的周期,然后可以避免一种形成,比如说当我们这个系统发生的慢时候,到底问题在哪?是网络还是数据库,或者是应用吗?还是跟其他的一些银行的接口方面出现性能的问题,到底这个平静的根源在什么地方?有了这个定位的功能以后,我们可以比较清晰地知道。
定位的问题我们就可以要求我们的服务外包商,甚至是开发商,去进行他们的一些调整、调控,我们就可以出报表。比如说像这个也是一个网站的变化,当时觉得首页各种各样的交易很慢,我们发现定位了问题以后,我们就叫开发商做优化,那么优化以后的效果怎么样呢?你可以在这张图上看得非常清晰。优化之前是31%的交易的成功率,优化之后达到了94%.它的成功率的变化,接近了2倍。在优化之前的交易相应时间需要2分钟,优化之后只需要6秒钟。这就是非常量化,可以让我们非常清晰,到底我的这些投入,我各种各样的技术升级和调优之后,我们的变化效果是怎么样的,这就是非常直观而清晰,可以让你的领导都看得非常明白的一张图表。
刚才我说了,要监控我们的客户体验,监控以后我们可以通过预防的方式,去减少我们的服务终止的事件,可以把这个实践按照优先级,可以定位或者是由报表提供。这一套就是我们CA对于应用系统管理的最佳实践。
这个最佳实践,其实可以保证在应用相关的各种角色,都提供他们所需要的数据。比如说我们可以让业务部门很清晰地、很明白地知道,我们的纳税人、我们的纳税大户,到底他的满意度是达到了一个怎么样的水平。我们的运维可以很清晰地知道,我们的服务到底正不正常、合不合格,质量怎么样。具体到了出现问题的时候,开发人员也可以用这个解决方案,去很清晰地定位这个问题,而不再说我们互相开会,有的时候可能会扯皮却解决不了这个问题,这就是给各方的人员、决策都可以参与到管理当中。
刚才所说的这套方案,其实说了这么多,它并不是一个初生的婴儿,不是一个刚成立一会儿的技术。它在全球当中已经有非常多的成功的案例,像美国的政府等,都是用这套解决方案去管理他们应用的服务。你可以看到我们的比例是非常多的,比如说银行的前20家有16家都是我们的最佳实践的客户。
我讲一个具体的案例,就是美国的咨询公司,它是全世界最大的中小企业以及个人的财务、税务管理软件公司,它是做软件的。但是,04、05年的时候,他们有业务变化,他们以前卖管理软件,直接变成了提供网上的报税服务,是面向纳税者。在07年的时候,他们出现了一个严重的性能问题,导致很多的纳税人不能够及时地报税,所以他也接收到了美国国税局的罚款。那么,通过使用我们CA的解决方案、CA的流程,以及CA网管集成以后,可以为他们公司提供一个非常精确、量化的视图,可以达到很好地管理他们的客户体验。最后,支撑他们的服务中心,让他们服务水平都得到非常好的支持,这是给他们的一个非常好的成果。
其实,CA它的独到之处是说为什么这么多的客户都选择我们的最佳实践呢?因为它的应用性能的创始者,BEA、IBM最开始的时候都是投资者之一,SAP跟我们是OEM的关系,一直是作为他们应用性能管理方案主推的方案。我们拥有产品,拥有行业最丰富的经验,可以帮助税务部门很快地处理应用性能的问题。
最后,希望我这个简短的介绍当中,能够为大家运维的思路有一些启发和帮助,谢谢大家!
来源:中国税务网
|