虚拟化平台设计1.1. 建设要求虚拟机之间可以做到隔离保护,单台虚拟机故障不会影响同一个物理机上 的其他虚拟机运行,每个虚拟机上的用户权限只限于本虚拟机之内,以保障系 统平台的安全性每个虚拟机可以安装操作系统,并且操作系统可以异构支 持完整的虚拟机生命周期管理,提供虚拟机的创建、修改、删除、启动、关 闭、重启、暂停、休眠、恢复、下电、查询等功能虚拟化管理系统支持动态 资源调度,保证物理服务器的负载处于均衡状态1.2. 建设原则•实现物理资源、虚拟资源的池化管理,按需、动态使用;实现IT资源即 时申请,快速提供;•当前已有的业务系统尽可能平滑迁移到云平台上,迁移后业务逻辑关系 和业务能力保持不变,不需要对业务系统进行软件改造;•云平台自身应该具备良好的可靠性,所有软、硬件应该冗余部署;同 时,云平台必须对业务系统虚拟机提供良好的可靠性保障,支持虚拟机 HA功能,尽可能减少故障情况下业务系统的中断时间,并快速自动恢复 业务系统;•云平台必须具备多重安全保障措施,从硬件层、虚拟化层、网络层、传 输层等各个层面为业务系统提供安全保障;•云平台必须具备统一的维护管理系统,实现对物理资源、虚拟资源的统一管理,简化管理流程,提升管理效率,降低维护管理开支;•云数据中心必须具备关键业务数据备份功能,保障关键业务系统出现故 障后业务数据不丢失,并且可以快速恢复业务;•云数据中心'需要具备容灾功能;•云平台必须能平滑扩缩(扩容、减容)、平滑升级。
1.3. 虚拟化平台设计数据中心虚拟化,是基于传统的硬件基础设施,采用虚拟化的软件技 术和统一的数据中心'管理平台,构建和传统数据中心'不一样的云数据中 心数据中心虚拟化之后,对外提供的能力比传统数据中心更多,管理更 加聚焦,而数据中心运行的用户应用不会发生业务逻辑变化,应用系统会 平滑迁移到云平台对于众多应用系统,提供整体的数据中心虚拟化解决方案,将上述部 分应用服务部署到虚拟化的高性能物理服务器上,达到高可靠、自动化运 维的目标众多物理服务器虚拟化成计算资源池(集群),保障云平台上的 业务在出现计划外和计划内停机的情况下能够持续运行在整个项目建设 过程中,还可以提供相关的专业咨询和迁移应用迁移服务数据中心虚拟化解决方案整体的整体逻辑架构如下图:应用房版删ail做CSV1= .数据中心虚拟化解决方案从逻辑上分为产品解决方案和专业服务解决方案,其中产品解决方案又分为硬件部分和软件部分,硬件部分是指可以提供从 数据中心'基础层的机房建设、供电、散热方案到数据中心使用的服务器(刀片 式或机架式,本次采用机架式服务器)、存储、网络设备、安全设备等全套硬件 产品当然,基于客户提供的机房现有可用硬件设施建设虚拟化数据中心,同 时兼容客户指定的业界主流的硬件产品。
软件部分以业界领先的虚拟化软件系 统为主体来构建云平台及管理系统,主要包括如下几个逻辑模块:虚拟基础架构层:基于服务器、存储、网络、安全等硬件设备,分别构建出虚拟计算资源池、虚拟存储资源池、虚拟网络资源池、虚拟安全资源池,实现对各类资源的 池化管理,由虚拟化软件按用户所需给虚拟机分配资源,释放后的虚拟资源会 被重新纳入资源池管理;同时,虚拟化软件基于资源池的统一管理,还实现了 虚拟资源基于用户策略的调度管理,提高资源利用率,节能减排该层还对外 提供了开放API接口,将虚拟基础架构层提供的对资源的各种操作、能力开放 出来,用户可以引入第三方厂家进行二次开发对接,构建能对外开放运营 的公有云系统,或者面向内部用户提供云服务的私有云系统该API接口 还兼容业界主流的 AWS API (Amazon Web Service)o演中心管理数据中心管理是云数据中心必不可少的功能,主要提供如下功能:(1) 资源统一管理:实现对云数据中心中虚拟资源、物理资源的统一 管理,包括资源的生命周期管理、资源分配等2) 云监控、告警:提供物理服务器、虚拟机、存储、交换机、物理 集群等各个维度各种性能指标的监控功能;提供各种软、硬件设备的不同 级别的告警界面呈现、邮件转发、告警短信提示功能;各类物理资源、虚 拟资源的拓扑呈现。
3) 开放API / SDK :对外提供开放API接口,并提供SDK开发包, 方便用户或第三方进行二次开发,对系统进行进一步集成4) VPC、VDC功能:为满足企业内部总部和多个分支机构之间、或 者多个业务部门之间对数据中心资源自主使用、自主管理的需求,VPC功 能可以从网络上对不同分支机构或不同部门的物理资源、虚拟资源进行隔 离,保证不同分支机构或不同部门的资源在各自子网内访问;VDC是从组 织的角度设置的逻辑概念,可以是一个部门或一个分支机构,每个VDC可 以被管理员划分一定的物理资源或虚拟资源,VDC管理员可以管理该VDC 下的资源,从资源管理、使用的角度进行了隔离(5)应用弹性伸缩:系统按照管理员设置的应用的资源使用的变更策略, 根据应用的负载轻重自动调整应用所需要的虚拟机数量,达到资源按需使用, 弹性伸缩6) 异构资源池管理:云管理平台可以管理 VMware vSphere 和 Citrix XenServer构建的虚拟化资源池,并且实现管理流程和操作的完全统一7) 基础设施管理:主要包括物理服务器、交换机、存储设备的接入、监 控、告警,物理服务器的上、下电控制8) 虚拟负载均衡:用户可以在管理平台上申请负载均衡器,将业务虚拟 机关联到负载均衡器。
负载均衡器根据用户设定的负载均衡策略,将业务请求 均匀分发到与之关联的虚拟主机上,使得每个业务虚拟机的负载基本均衡,保 证业务运行的稳定性和可靠性9) 报表管理:支持将监控数据导出为报表,便于用户进行进一步分析和 管理10) 系统管理:包括用户管理、系统配置、定时器设置、设置密码规则 等功能11) 桌面管理:管理平台中集成了桌面云系统的管理入口,可以支持桌 面云、云主机的统一管理应用层应用层不属于范畴,是指运行在虚拟机上的用户应用系统,使用统一分配 的计算、存储、网络资源,由虚拟化平台提供必要的安全保障1.3.L多层次安全防护设计1 3//I.虚拟化安全虚拟机隔离设计虚拟机隔离指同一物理机上不同虚拟机之间的资源隔离,是虚拟化能 够实际应用的基本特征之一隔离包括CPU、内存、内部网络隔离和磁盘 I/O等的隔离操作维护账号管理、认证和授权虚拟化管理平台支持操作管理员账户周期管理提供一个缺省的超级 管理员账户(admin),使用该账户可创建其他账户并授予相应的权限支持角色管理功能和基于角色的授权功能,目前云管理系统支持三种 角色定义:超级管理员、操作维护管理员、游客,分别对应不同的权限控 制。
虚拟化平台操作系统的裁剪和加固各虚拟化服务器的操作系统均进行针对性的了模块裁剪、安全加固和 安全设置,只安装业务需要的组件,其它无关组件一律不安装,尽可能减 少HostOS的安全漏洞安全配置各虚拟化服务器的操作系统(HostOS)参考CIS (Center forInternet Security) Linux操作系统安全benchmark进行了安全配置:如关闭不安全的服务,设置账号密码复杂度策略、合理设置文件和目录的权限安全补丁管理具有严格的安全补丁管理流程,定期在网站上发布经过测试的操作系统补 丁包,由维护管理人员定期下载和安装操作系统补丁恶意虚拟机防护防止恶意虚拟机的地址欺骗:Hypervisor的vSwitch中将虚拟机的IP地 址和MAC地址绑定,限制虚拟机只能发送本机地址的报文,防止虚拟机IP地址 欺骗和ARP地址欺骗虚拟机的恶意嗅探:Hypervisor中的vSwitch为交换型以太网(非Hub的 共享型广播型),不同虚拟机的数据包被转发到指定的虚拟端口,即使在同一台 物理宿主机上的虚拟机上也接收不到其他虚拟机的数据包,防止虚拟机的恶意 嗅探1 3.¥.数据安全数据安全是保障数据中心安全的重点。
为了保障用户的数据安全,虚拟化 平台从数据隔离、访问控制等多个方面采取措施用户卷访问控制系统对每个卷定义不同的访问策略,没有访问该卷权限的用户不能访问该 卷,只有卷的真正使用者(或者有该卷的访问权限)才可以访问该卷,每个卷 之间是互相隔离的存储节点接入认证存储节点是采用标准的iSCSI进行访问,并且支持CHAP (Challenge Handshake Authentication Protocol)认证功能,CHAP 认证功能可以提 高应用服务器访问存储系统的安全性存储系统启用CHAP认证以后,应用服务器侧也必须启用CHAP认证, 同时在存储系统中把应用服务器的信息加入到存储系统的合法CHAP用户, 只有经过CHAP认证通过以后才能连接到存储系统并存取数据剩余数据彻底擦除当用户把卷卸载释放后,系统在把该卷进行重新分配之前,可以选择 对该卷进行彻底的数据格式化,以保证该卷上的用户数据的安全性存储的用户文件/对象删除后,对应的存储区进行完整的数据擦除,并 标识为只写(只能被新的数据覆写),保证不被非法恢复数据多重备份云数据中心的数据存储采用多重备份机制,每一份数据都可以有一个 或者多个备份,当数据因存储载体(如硬盘)出现故障的时候,不会引起 数据的丢失,也不会影响系统的正常使用。
系统同时对存储数据按位或字节的方式进行数据校验,并把校验的信 息均匀的分散到的阵列的各个磁盘上阵列的磁盘上既有数据,也有数据 校验信息,数据块和对应的校验信息会存储于不同的磁盘上,当一个数据 盘损坏时,系统可以根据同一带区的其他数据块和对应的校验信息来重构损坏 的数据SAN设备数据保险箱技术SAN存储设备遭遇意外全部掉电时,可以采用数据保险箱技术保证数据的 安全和完整性数据保险箱技术介绍:从系统中的某几块硬盘上划分出一定区域,用来专门存放因突然掉电而尚 未及时写入硬盘的Cache数据和一些系统配置信息当系统外部供电全部中断 时,则可以通过内置电池或外置UPS供电,使得Cache中的数据能够写入数据 保险箱中当外部电力恢复时,控制器再将数据从数据保险箱中读回到Cache 中,继续完成对数据的处理1 :3一” .3.管理安全虚拟化带来了成本降低、效率提高等一系列好处的同时,由于计算、存储 的集中,对管理维护提出了更高的安全要求,以保障基础设施的安全运行虚拟化平台从管理流程的角度对安全性做了多重保护:管理员账号分权分域管理的系统管理员都支持“分权分域”管理:(1)分权:即区分不同管理员的操作权限,管理员的权限由“角色”定义。
一个“角色”可拥有一个或多个不同的系统操作权限,一个管理员可拥有一个或 多个不同的“角色”通过绑定管理员和“角色”,实现管理员和系统操作权限的绑 定如果一个管理员拥有多个“角色”,其拥有的系统操作权限是多个“角色”拥有 的系统操作权限的并集平台支持灵活的角色设置,并灵活赋予角色拥有 的权限2) 分域:即系统最高管理员对低级别管理员划分各自负责的“数据 和资源的管理范围”通过对管理员设置“分权分域''限制,使不同级别、不同企业、不同部 门的管理员只负责各自管理范围内的业务,避免了越权操作,保护了系统 数据的安全日志管理平台支持集中的日志收集和存储,同时通过部署日志审计系统,满足 客户的安全审计需求,如SOX要求虚拟化平台支持以下三类日志:(1) 操作日志:操作日志记录管理员实施的管理维护操作,包括用户名、操作类型、 客户端IP、关键参数、操作时间、操作结果等内容,存放在管理节点的数 据库中审计人员可通过界面操作导出和查看操作日志,定期审计管理员 实施过的操作,及时发现不当或恶意的操作管理员是无法删除操作日志 的,所以操作日志也可作为抗抵赖的证据2) 运行日志:运行日志记录系统各节点的运行情况,可由日志级别参数来控制不同 级别日志的输出。
运行日志包括日志级别、线程名称、运行信息等内容,系统维护人员可通 过查看运行日志,了解和分析系统的运行状况,及时发现和处理异常情况3)黑匣子日志:黑匣子日志记录系统宕机的定位信息,主要用于故障定位和故障处理,便 于快速恢复业务其中计算节点产生的黑匣子日志通过TFTP协议汇总到日志服 务器统一存放,而管理节点、存储节点产生的黑匣子日志本地存放系统支持集中的日志收集和存储,如下图所示:集中日志管理在各节点部署有日志收集代理,实时收集本地产生的运行日志、黑匣子日 志,通过配置日志收集代理实现将日志数据过滤成高级别日志和完整日志高 级别日志定期汇总到集中日志服务器完整日志通常存在节点本地,可通过脚 本把指定节点、指定时间段的完整日志汇总到日志服务器平台的配套提供了一键式日志获取工具,可以在系统故障后快速获取黑匣 子日志,快速定位问题,快速恢复安全告警管理安全告警是指当系统侦测到违背安全策略的事件行为发生时,将安全事件 相关的一些信息通过安全告警上报给管理平台,管理员根据这些信息对违背安 全策略的行为进行及时处理,排除安全隐患安全告警上报的内容包含了告警 的来源、告警产生的时间、告警产生的原因、服务提供者、服务使用者、告警 级别、事件类型等信息。
1.32可靠性设计数据中心虚拟化项目从整体、服务器、存储、网络、虚拟化多个层面 综合考虑系统可靠性,保障业务的续性1 321 .虚拟化可靠性虚拟化是数据中心'的核心'机制,数据中心'进行采用虚拟化后,支持虚 拟机热迁移,虚拟机HA功能,保障业务系统的连续性支持对虚拟机的 快照功能,系统提供虚拟机、卷快照功能,便于在系统出现故障的时候还 原系统I :如?管理可靠性管理模块均采用1+1备份或负载均衡的方式运行,保障系统运行的可 靠性支持对物理服务器、软件和资源的监控系统可以收集服务器的核心 指标如CPU使用情况、基础网络流量和内存数据等,检测到诸如进程异 常、管理和存储链路异常,节点异常、系统资源过载等各种故障并上报告 警,此类告警一般可由系统自行恢复或者由管理员及时处理,使系统保持 完善的故障检测能力和故障恢复能力所有的物理服务器管理上都引入了电信领域“黑匣子”技术,在系统出 现异常时自动存储内核日志、系统快照、内核诊断信息及临终遗言,并保 存至非易失性存储设备(计算节点)或自动传送至网络服务器(例如日志 服务器),以便系统故障后,导出分析黑匣子日志,快速定位故障问题,恢复系 统正常运行。
I 323服务器可靠性虚拟化服务器支持对CPU,内存,风扇,电源,硬盘等热关键器件的温度 实时监控,设备故障时会产生告警配合智能的风扇调速和监控,确保服务器 硬件系统运行的可靠性虚拟化服务器一般都支持硬盘热插拔和RAID功能,提供硬盘故障检 测和预警支持电源1+1冗余和热插拔这些措施都可以保证服务器的可靠 性1 3一2.‘1.存储可靠性设计数据中心虚拟化一般采用集中共享式SAN存储设备,虚拟化平台支持存储 冷迁移、支持根据存储访问IO进行存储动态资源调度(DRS : Dynamic Resource Scheduler)支持存储多路径,每个计算节点与存储集群之间,至少配置两个完全冗余 的物理路径,一般从虚拟机到存储设备有8条访问路径,保障存储网络的可靠 性SAN存储设备采用双控制器以保证物理链路的可靠性,在SAN高可靠性的 基础之上,配置热备盘做冗余备份,保证数据不丢失和故障快速恢复■I 3.Z5,网络可靠性设计虚拟化中心的组网中,所有的网络链路都是物理上冗余配置的通过使用 交换机堆叠技术,保证物理服务器对外与汇聚层交换设备和对内虚拟网络层连 接的冗余虚拟网络层通过采用多网卡绑定等技术避免单个网卡故障引发的业 务中断。
对于各通信平面(业务、存储、管理)均采用双网卡,双网卡采用了 Bonding模式,两网卡被绑定成逻辑上的“一块网卡''后,同步一起工作既 能对服务器的访问流量进行负荷分担,又能保证网卡的可靠性1.3.3.云数据中心管理虚拟化管理平台聚焦于数据中心'虚拟化资源管理、自动化运维发放、 并对企业IT管理提供开放的管理接口云管理系统将整个数据中心云化, 并对系统中用户可见的资源抽取出来纳入统一的资源池管理,为用户提供 一体化的资源管理,自动资源发放,同时为用户提供了方便的获取资源的 途径用户可以通过在服务目录自动化的获取资源并在资源上部署用户需 要的应用虚拟化平台系统架构如下图:爰现,配直,编tt,模板.部署等其他曾埋平台组织官理员.业务系筑管哩员管理员和最建用户服务服务用户权目录自动化限管理北向按口缆-Portal和移助接入..、虚拟化管理服务总铐(含眼务框架,内部通信息戏,消息队列):括件化曲:连接器关联余祈 和报表监控 数据仓库黄源分配策略■ U曼,预警・ 夏用策略等:i融发调度等■较标准的度口 ”集成资源管理集成资源数据库自动资源调度虚拟化平台系统架构参考方框内是虚拟化平台的功能模块虚拟化管理”可以是虚拟化软件建成的 资源池,也可以管理其他厂家的虚拟化资源池,如VMware的vCenter+vSphere 或 Citrix 的 XenServer。
虚拟化管理软件从软件层面拉通统一各资源管理虚拟化平台负责全系统 硬件和软件资源的操作维护管理,用户业务的自动化运维从功能上划分,可 以分为统一资源管理、自动化运维、用户权限管理、开放API接口、监控管 理、告警管理、拓扑管理、日志管理、客户二次开发几个功能模块I 3.3.1.统一资源管理虚拟化平台,通过对各种物理资源、虚拟化资源数据统一建模,将资源以 用户可见的资源池形式提供给系统用户即上层应用统一资源管理可以屏蔽不同硬件和虚拟化的差异,资源的更换升级对 用户零感知实现对所有硬件资源进行统一管理,包括设备自动发现、自 动配置和故障监控等,实现资源快速发放,缩短业务上线时间虚拟化平台支持对资源分集群管理,支持集群的创建、删除、扩容、 减容,对集群进行性能监控,配置基于集群的资源调度策略(DRS),调度 策略可以设置为手动和自动,实现虚拟机根据业务负荷在不同服务器上自 动迁移虚拟化平台支持对虚拟机生命周期管理:业务管理员可以进行虚拟机 的创建、销毁操作,对虚拟机的日常维护包括:启动、重启、迁移、关 闭、快照、休眠、唤醒、虚拟机资源调整和监控等虚拟化平台支持虚拟化网络资源的管理:对子网、WLAN、端口组、 分布式交换机的相关配置进行管理。
虚拟化平台支持虚拟存储资源的管理:可以管理IPSAN、FC SAN、 NAS等存储资源,支持向存储资源池中增加、删除数据存储,对已经存在 的数据存储可以进行扩容1 3.3.2,自动化运维自动化运维是虚拟化平台提供的主要功能之一管理员可以实现物理 服务器的自动发现,虚拟机、操作系统和应用软件自动化部署,提高管理 平台的管理维护效率自动化运维功能主要体现在以下几点:(1)、物理服务器自动发现、自动发放通过单个输入或批量导入物理机服务器信息,系统解析输入信息并自动化 发现已上电服务器详细信息,包括服务器电源、风扇、CPU、内存、磁盘网卡 等信息,将物理服务器纳入系统管理范围最终用户从系统申请物理机时,云管理系统会根据用户要求自动选择特定 型号、规格、操作系统类型和版本等信息,自动化选择合适的物理机、自动化 安装和配置操作系统,实现自动化发放物理机2) 、应用自动化部署系统支持按预创建的应用模板,自动化的完成应用所需要的虚拟机、软件 包、以及依赖配置关系的自动创建和分发,从而完成模板所描述的应用实例的 自动化创建,实现应用自动化部署,将应用实例的创建时间从数天、数小时, 缩短到数分钟3) 、应用弹性伸缩管理员通过配置不同的调度策略,可以实现智能资源调度,提升设备利用 率,满足虚拟机应用对资源弹性伸缩的需求。
华为云管理系统集中管理和维护管理员设置的调度策略,保证资源的合理 分配,实现资源最大化利用或实现节能目标等根据应用场景,可以分为三种 策略类型:组内自动伸缩策略、组间资源回收策略和时间计划策略组内自动伸缩策略针对单独的应用而言,系统根据应用的当前负载情况动态的调整应用实际 使用的资源,当一个应用资源负载较高时,系统自动启动该应用备用虚拟机或 添加虚拟机并安装应用软件,分担当前应用的负荷;当应用的资源负载很 低时,系统自动关闭或删除虚拟机,释放相应的资源通过启动、添加、 关闭、删除虚拟机等动作,实现应用所需的资源自动伸缩组间资源回收策略当整个虚拟化系统资源不足的情况下,云管理系统可以根据管理员设 置的应用组间的资源复用策略,使优先级高的应用优先获取资源,使优先 级低的应用释放资源,以供优先级高的应用使用时间计划策略时间计划策略允许用户对于不同的应用实现资源的分时复用用户可 以设置时间计划策略,使得不同的应用分时段的使用系统资源,比如说白 天让办公用户的虚拟机使用系统资源,到了晚间可以让一些公共的虚拟机 占用资源智能负载调度智能节能调度策略根据应用系统的CPU、内存负荷的策略,实现轻载虚拟机合并到某台 服务器,将空闲服务器下电,实现节能降耗;重载情况下,将未上电的服 务器上电并投入系统使用,将重载服务器上的虚拟机通过热迁移方式分离 到新上电的其它服务器,实现服务器的负载均衡,保证应用的性能和用户感 受。
I 333.用户权限管理云管理系统提供基于角色的用户权限控制功能,包括用户管理、角色管 理、角色授权、登陆认证、鉴权等功能,实现全系统的安全功能角色和操作 权限管理,不同角色对应不同的操作权限,不同的操作用户对应于不同的角 色云管理系统可以为不同的管理员或用户进行“分权分域''管理,即不同管理 员分配不同管理范围和业务访问权限,方便不同部门、不同组织的管理员的业 务分工在鉴权过程中,云管理系统还可以和用户自己的鉴权机制进行对接进行权 限认证I 334开放API接口华为云平台对外屏蔽了各种资源的来源,对外提供开放API接口外部第 三方系统可以获取到云计算系统的各种资源信息,比如集群信息,服务器资 源,虚拟机信息,虚拟网络信息,监控、告警数据,网元拓扑数据等同时,外部第三方系统还可以通过API对系统资源进行操作维护比如支 持对虚拟机的生命周期管理,包括启动,停止,重启,迁移等操作,支持对服 务器的上电,下电,重启等操作只要是云平台支持的操作功能,都有对应的 开放API接口对外提供I 335.监控管理云管理系统监控的对象主要针集群、物理服务器、虚拟机、网络交换机、 存储设备等进行监控对集群的监控指标包括:>告警统计;>虚拟机运行情况;>平均CPU趋势对比;>平均内存趋势对比;>平均网络流量趋势对比(网络流出);>平均网络流量趋势对比(网络流入)对物理服务器的监控指标包括:>告警统计;>该服务器上运行虚拟机运行状态;> CPU占用率;>内存占用率;>网络流入流出速率; >磁盘I/O,磁盘占用率对存储设备的监控指标包括:>告警统计;>挂载情况;>总容量;>总分配、总剩余对网络交换机的监控指标包括:>流入流出速率;>端口信息状态;>端口数据流量对虚拟机的监控指标包括:>告警统计;>虚拟机状态;> CPU占用率;>内存占用率;>网络流入流出速率;>磁盘I/O,磁盘占用率I 3.3.6.告警管理在物理资源与虚拟资源出现故障时,告警管理模块会及时发出告警信息, 提醒管理员处理故障。
对于可自动恢复的告警,如各种阈值告警,在系统负载下降后,告警 状况解除,系统会自动发出告警解除信息,此类告警管理员不用特别对 待,只需要了解告警产生及解除的过程,在业务部署时尽可能避免即可云平台支持对物理设备、虚拟化设备和虚拟机的故障检测,如服务器 的RAID、配件检测、交换机、存储设备的检测,虚拟机HA、虚拟机快 照、虚拟机迁移、存储迁移的故障检测等故障检测后如果发现故障,系统会进行分级上报,分为紧急、重要、 次要和提示四种告警级别,标识不同严重程度的系统故障,便于管理员分 类处理虚拟化平台界面可通过不同的声音、颜色标识不同级别的告警,呈现 给管理维护人员管理员可配置告警处理Email和短信通知告警功能:告 警产生和恢复时,系统会自动给运维人员发Email和短信,及时告知通 过订阅重要的告警,管理员可实现在无人值守的环境下,仍能实时掌握云 数据中心全网节点的运行状态1 33 了拓扑管理拓扑管理提供一个可视化界面,自动呈现云平台全系统的所有资源的 拓扑信息,无需管理员手动配置通过拓扑视图可以查看物理硬件资源视 图,应用部署以及虚拟机资源视图获取硬件资源(计算硬件、存储硬件、网 络硬件)、应用部署情况(例如,数据库服务器部署在哪台虚拟机上,虚拟机位 于哪台主机上)、虚拟机属性等信息。
拓扑节点会和告警中心关联,及时呈现对象当前的监控状态拓扑管理呈 现选中集群的资源占用情况和监控状态I 3.3.8.日志管理虚拟化平台的日志管理主要记录管理员的操作日志、系统的运行日志、业 务和系统异常故障的黑匣子日志操作日志记录了虚拟化平台上所有管理员的操作过程和结果,主要用于事 后审计使用运行日志记录系统运行的异常和关键轨迹,用于系统的日常维护和巡检查 看使用黑匣子日志记录系统出现严重故障如宕机时的故障点、故障原因等信息, 便于管理员和研发维护人员尽快定位问题,解除故障操作日志不允许管理员删除,以便于后续安全审计,避免管理员做非法的 操作1 3一3.9客户二次开发云管理系统对外提供7SDK包,方便第三方集成厂商快速集成开发SDK 支持多语言且提供灵活的API接口,客户可以通过SDK,便捷的进行二次开 发,从而实现对虚拟化平台的灵活操作和管理。