6.2.3.3 常规作业
物理资源(网络及网络设备、服务器、存储)的常规作业
6.2.4 响应支持
6.2.4.1 事件驱动响应
针对物理资源的故障引起的业务中断或运行效率无法满足正常运行要求,而进行的响应服务,包括但不限 于:
a) 网络及网络设备事件驱动响应
1) 故障定位;
2) 停止、启动进程;
3) 中断、连通网络连接;
4) 关闭、启动端口;
5) 网络备件更换;
6) 更改、恢复配置。
b) 服务器事件驱动响应
1) 服务器重启;
2) 更换故障部件,包括主板、电源、CPU、内存、硬盘等;
3) 服务器关键部件微码升级;
4) 服务器硬盘RAID配置修复。
c) 存储事件驱动响应
1) 存储重启;
2) 配置文件恢复;
3) 更换故障部件,包括电源、硬盘等;
4) 微码升级;
5) 存储管理软件补丁安装;
6) 数据修复。
6.2.4.2 服务请求响应
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服务,包括但不限于:
a) 网络及网络设备服务请求响应
1) 增加、降低网络接入的数量或速度;
2) 更改网络设备配置;
3) 启动、关闭端口或服务;
4) 更换、更新或升级设备硬件或软件。
b) 服务器服务请求响应
1) 服务器设备搬迁;
2) 服务器设备停机演练;
3) 服务器设备清洁维护等。
c) 存储服务请求响应
1) 存储设备搬迁;
2) 存储设备停机演练;
3) 存储设备清洁维护;
4) 存储硬盘空间扩容;
5) 存储结构调整;
6) 新增主机分配存储空间;
7) 主机端多路径软件的安装配置。
6.2.5 优化改善
6.2.5.1 适应性改进
根据应用系统特点和运行需求,对物理资源进行调整,包括但不限于:
a) 网络及网络设备适应性改进
1) 路由策略调整;
2) 设备或链路负载调整;
3) 安全策略调整;
4) 监控对象覆盖范围调整;
5) 局部交换优化;
6) 局部冗余优化。
b) 服务器适应性改进
1) 服务器硬盘RAID配置调整;
2) 服务器网络、光纤链路冗余调整;
3) 服务器电源供电接入冗余调整。
c) 存储适应性改进
1) 存储设备读写Cache比例调整;
2) 存储设备RAID保护级别调整;
3) 存储设备新增硬盘,包括新增磁盘扩展柜;
4) 存储设备逻辑盘的容量调整;
5) 存储设备分配主机的调整;
6) 光纤交换机ZONE规划调整。
6.2.5.2 增强性改进
根据应用系统的特点和运行需求,通过对物理资源的运行记录、趋势的分析,对物理资源进行调整、扩容或 升级,包括但不限于:
a) 网络及网络设备增强性改进
1) 硬件容量变化,如网络设备硬件、软件升级、带宽升级等;
2) 整体网络架构变动;
3) 网络架构容量变化,如网络子系统的增减等;
4) 系统功能变化,如新增功能区、新增安全系统、新增审计系统等;
5) 路由协议应用及部署调整;
6) 整体安全策略收紧;
7) 交换优化;
8) 冗余优化。
b) 服务器增强性改进
1) 为本服务器从存储系统上分配更大空间;
2) 服务器CPU个数增加;
3) 服务器内存容量增加;
4) 服务器磁盘空间扩容;
5) 服务器网卡和HBA接口卡增加等。
c) 存储增强性改进
1) 存储设备控制器、硬盘等部件的微码升级;
2) 存储设备新增硬盘扩容,包括新增磁盘扩展柜;
3) 存储设备Cache容量增加;
4) 存储设备光纤模块的升级;
5) 光纤交换机的光纤模块升级;
6) 存储设备管理软件的版本升级。
6.2.5.3 预防性改进
根据对物理资源的运行记录、趋势的分析,结合应用系统的需求,发现物理资源的脆弱点及潜在的隐患,有 针对性地进行改进性作业,包括但不限于:
a) 网络及网络设备预防性改进
1) 配置参数优化,例如关闭不必要的服务、打开缺省的增强功能、加快三层网络路由收敛速度、加快二层网 络生成树收敛速度等;
2) 安全优化,例如密码加密,TELNET控制等;
3) 提高软件配置命令可读性。
b) 服务器预防性改进
1) 检查服务器硬盘RAID配置,及时修复或更换故障硬盘;
2) 增加服务器网卡、光纤卡以及链路冗余情况;
3) 增加服务器电源供电模块冗余。
c) 存储预防性改进
1) 收集磁盘空间的使用情况,及时清理垃圾数据或增加存储设备容量;
2) 查看存储控制器电池的使用情况,及时更换新的电池;
3) 检查存储设备的电源是否老化,及时更换新的电源; 4) 查看存储设备的读写性能,适时调整存储控制器的Cache容量。
6.3 虚拟资源
6.3.1 服务对象
服务对象包括虚拟网络资源、虚拟计算资源、虚拟存储资源。其中虚拟网络资源含虚拟网卡、虚拟网络设 备、虚拟链路、虚拟机网络和网络设备等;虚拟计算资源包括虚拟机、虚拟机宿主机、虚拟计算资源池 (Resource Pool)集群等;虚拟存储资源包括虚拟存储卷、存储资源池、服务控制器等。
6.3.2 调研评估
通过对虚拟资源的运行记录、运行趋势进行分析,根据应用系统的特点和运行需求,提出物理设备、虚拟资 源的改进建议和方案,调研评估服务包括但不限于:
a) (整体或局部)虚拟资源实际负荷与承载能力分析;
b) (整体或局部)虚拟资源预期负荷与承载能力分析与建议;
c) (整体或局部)虚拟资源架构分析与建议;
d) (整体或局部)虚拟资源安全策略分析与建议;
e) (整体或局部)虚拟资源配置调优分析与建议等。
6.3.3 例行操作
6.3.3.1 监控
对虚拟资源的监控内容
6.3.3.2 预防性检查
应在监控服务的基础上,对虚拟资源进行预防性检查。包括:性能检查、脆弱性检查。
6.3.3.3 常规作业
虚拟资源的常规作业
6.3.4 响应支持
6.3.4.1 事件驱动响应
针对虚拟资源及所依赖的硬件故障引起的业务中断或运行效率无法满足正常运行要求,而进行的响应服务, 包括但不限于:
a) 故障定位;
b) 虚拟资源重新调配、紧急迁移、紧急扩容;
c) 解决虚拟资源所依赖的物理资源故障和缺陷,包括:服务器、网络及网络设备、存储、仲裁控制点(磁 盘、光纤链路、服务器等)等;
d) 虚拟资源紧急操作,如更换、中断、连通网络连接、关闭、启动端口、更改、恢复配置、停止及启动进 程、重启等。
6.3.4.2 服务请求响应
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服务,包括但不限于:
a) 虚拟机、配置信息、数据的备份与恢复;
b) 虚拟机迁移、回收、变更;
c) 虚拟资源池的容灾、高可用配置、计划实施与演练;
d) 数据统一存储;
e) 数据访问性能优化;
f) 数据在线迁移与分级存储;
g) 新增主机分配存储空间;
h) 现有主机存储空间调整;
i) 主机端多路径软件的安装配置;
j) 虚拟资源池的扩容、调配、变更;
k) 增加、降低虚拟网络资源网络接入数量或速率;
l) 更改虚拟网络资源配置;
m) 启动、关闭端口或服务;
n) 更换、更新或升级虚拟网络资源硬件或软件。
6.3.5 优化改善
6.3.5.1 适应性改进
根据应用系统特点和运行需求,对虚拟资源进行调整,包括但不限于:
a) 虚拟网络设备或链路负载调整;
b) 虚拟网络安全策略调整;
c) 虚拟网络监控对象覆盖范围调整;
d) 虚拟网络路由策略调整;
e) 虚拟网络交换及冗余优化;
f) 虚拟网络资源调配;
g) 虚拟机计算资源CPU、内存容量、硬盘容量、网络的调整;
h) 虚拟机计算资源迁移;
i) 虚拟化计算资源调度的算法;
j) 虚拟存储服务控制器前后端网络(SAN或IP)端口吞吐速率的调整;
k) 根据数据生命周期,进行存储资源分层调整;
l) 数据存储平衡算法调整;
m) 虚拟存储卷保留份数调整;
n) 虚拟存储卷镜像复制级别调整。
6.3.5.2 增加性改进
根据应用系统的特点和运行需求以及数据量处理能力要求,通过对虚拟资源的运行记录、趋势的分析,对虚 拟资源进行调整、扩容或升级,包括但不限于:
a) 虚拟网络资源调整,如CPU、内存、端口的调配、扩容回收;
b) 虚拟网络资源网络架构变动;
c) 虚拟网络架构容量变化,如网络子系统的增减等;
d) 虚拟网络系统功能变化,如新增安全系统、新增审计系统等;
e) 虚拟网络路由协议应用及部署调整;
f) 虚拟网络整体安全策略收紧;
g) 虚拟网络资源冗余优化;
h) 虚拟计算资源宿主机服务器和虚拟机计算能力扩容;
i) 虚拟计算资源宿主机服务器和虚拟机内存扩容;
j) 虚拟计算资源宿主机服务器和虚拟机网络吞吐能力扩容;
k) 虚拟计算资源高可用性增强与演练;
l) 虚拟计算资源容错机制增强与演练;
m) 虚拟计算资源备份恢复测试;
n) 虚拟存储服务控制器节点数量增加;
o) 虚拟存储服务控制器内存容量增加;
p) 虚拟存储服务控制器CPU性能增强;
q) 虚拟存储服务控制器前后端网络(SAN或IP)端口增加;
r) 虚拟存储服务控制器后端分布式物理存储的Cache、容量等增加;
s) 虚拟存储服务控制器微码升级;
t) 存储虚拟化软件升级。
6.3.5.3 预防性改进
根据对虚拟资源的运行记录、趋势的分析,结合应用系统的需求,发现虚拟资源的脆弱点及潜在的隐患,有 针对性地进行改进性作业,包括但不限于:
a) 虚拟网络配置参数优化,例如虚拟网络资源的VLAN、QoS、ACL、带宽等;
b) 虚拟网络部署路由策略情况下端到端选路变化、端口流量变化、路由条目变化;
c) 根据系统监控得到的信息替换可能存在问题的内存,CPU,硬盘,网络设备等;
d) 根据系统的压力增长趋势主动对物理服务器的数量进行必要的扩容;
e) 根据系统的发展趋势对网络系统采取必要的扩容;
f) 收集存储资源池空间的使用情况,及时清理垃圾数据或增加存储资源池的容量;
g) 监控服务控制器的负载情况,必要时增加硬件数量,或提高硬件规格;
h) 监控服务控制器的硬件出错率,替换存在问题的硬件;
i) 监控服务控制器后端分布式物理存储的硬件出错率,替换存在问题的硬件;
j) 监控仲裁控制点(磁盘、光纤链路、服务器等)的运行情况;
k) 服务控制器微码升级;
l) 存储虚拟化软件升级。
6.4 平台资源
6.4.1 服务对象
服务对象包括操作系统、数据库、中间件等系统软件。
6.4.2 调研评估
通过对平台资源软件的运行记录、运行趋势进行分析,根据应用系统的特点和运行需求,提出处理或改进的 建议和方案。
6.4.3 例行操作
6.4.3.1 监控
重点是对平台资源(操作系统、数据库、中间件等)的运行状态、运行性能、资源使用分配情况进行监控, 以便了解其是否满足运行要求。监控应当采用合适的装备与手段,分配专门人员定期或全时段进行监控。
6.4.3.2 预防性检查
应在监控服务的基础上,对平台资源(数据库、中间件等)进行预防性检查。包括:性能检查、脆弱性检 查。
6.4.3.3 常规作业
对平台资源(数据库、中间件)的常规作业
6.4.4 响应支持
6.4.4.1 事件驱动响应
针对设备的软、硬件故障、误操作等引起的业务中断或运行效率无法满足正常运行要求,而进行的响应服 务。包括但不限于:
a) 操作系统事件驱动响应:
1) 操作系统损坏;
2) 操作系统CPU、内存等资源耗尽;
3) 操作系统服务进程无效;
4) 操作系统文件系统空间不够;
5) 操作系统网口无法通讯;
6) 操作系统无法识别外置存储空间。
b) 数据库事件驱动响应:
1) 数据文件坏块修复;
2) 数据库重启; 3) 网络侦听重启;
4) 数据库备份恢复;
5) 数据库解锁。
c) 中间件事件响应驱动:
1) 程序恢复;
2) 应用服务重启;
3) 配置文件恢复;
4) 守护服务调整。
6.4.4.2 服务请求响应
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服务。包括但不限于:
a) 操作系统服务请求响应:
1) 操作系统版本升级;
2) 操作系统死机修复;
3) 操作系统文件系统损坏修复;
4) 操作系统文件系统空间扩容;
5) 操作系统IP地址修改;
6) 操作系统参数调整;
7) 操作系统日志清理。
b) 数据库服务请求响应:
1) 数据库版本升级;
2) 数据库灾难恢复;
3) 数据清理和维护。
c) 中间件服务请求响应:
1) 中间件服务器更换;
2) 中间件参数调整;
3) 中间件软件版本升级。
6.4.5 优化改善
6.4.5.1 适应性改进
根据应用系统特点和运行需求,分析平台资源软件的运行情况,调整平台资源软件不合理的初始容量配置、 参数配置等,以满足应用系统的运行需求,包括但不限于:
a) 操作系统适应性改进:
1) 操作系统交换区容量调整;
2) 操作系统内核参数调整;
3) 操作系统文件系统使用空间调整划分;&l
关注卓越空间
关注卓越微博
关注卓越微信