最新资讯
  1. 服务器托管中独立服务器的意义     [2013-9-23]
  2. 如何判断网络运行状况     [2013-9-23]
  3. 服务器托管七种维护安全最佳技巧     [2013-9-23]
  4. 企业在服务器托管中遇到技术浅谈     [2013-9-23]
  5. 服务器性能基准测试工具盘点     [2013-9-23]
  6. 服务器托管基本功能     [2013-9-23]
  7. 武汉服务器维修给你安全的保障     [2013-11-19]
  8. 服务器的未来趋势     [2013-11-20]
  9. 服务器维护的七个技巧     [2013-11-21]
  10. 服务器常见故障判断与维修     [2013-11-22]
  11. 武汉服务器维修升级的原则     [2013-11-25]
  12. 武汉服务器维修:事件查看器的相关知识     [2013-11-25]
  13. 武汉服务器主板维修     [2013-11-26]
  14. 服务器电源维修     [2013-11-26]
  15. 武汉服务器维修与解决方法     [2013-11-27]
  16. 服务器常见故障     [2013-11-27]
  17. 服务器打不开的几个因素     [2013-11-28]
  18. 服务器的维护技巧     [2013-11-28]
  19. 武汉服务器维修应该怎么做     [2013-11-29]
  20. 武汉维护服务器维修以及安全的七大技巧     [2013-11-29]
  21. 武汉服务器维修-服务器安全防护与攻略指南     [2013-12-2]
  22. 武汉服务器维修-五种策略提高服务器整合比率     [2013-12-2]
  23. 武汉服务器维修-服务器不能正常运行的那些因素     [2013-12-2]
  24. 武汉服务器维修-服务器维护应该注意的四点     [2013-12-2]
  25. 服务器托管、租用、虚拟主机的区别     [2013-12-3]
  26. FTP网站上传功能     [2013-12-3]
  27. 浅谈Vps于独立服务器各自的优势     [2013-12-4]
  28. 三种方法让你选到适合你的服务器     [2013-12-4]
  29. Vps以及独立服务器各自的用途     [2013-12-4]
  30. 怎么样选择vps于独立服务器     [2013-12-4]
  31. 域名DNS解析     [2013-12-5]
  32. 泛域名解析和子域名     [2013-12-5]
  33. 服务器托管五个重点问题详解     [2013-12-6]
  34. 服务器硬盘故障解决的方法     [2013-12-6]
  35. 服务器故障排查的方法     [2013-12-6]
  36. 数据库服务器应具备三大必要条件     [2013-12-6]
  37. 武汉服务器维修-服务器选型与企业七大常见应用     [2013-12-10]
  38. 武汉服务器维修-五种策略提高服务器整合比率     [2013-12-10]
  39. 武汉服务器维修-文件WEB服务器的应用方案     [2013-12-10]
  40. 武汉服务器维修-私有虚拟化服务器原理与应用详解     [2013-12-10]
  41. 武汉服务器维修-刀片服务器与机架式服务器的选择     [2013-12-11]
  42. 武汉服务器维修-服务器内存性能与产品分析     [2013-12-11]
  43. 武汉服务器维修-惠普服务器虚拟化新技术降低网络成本     [2013-12-11]
  44. 武汉服务器维修-全球服务器与存储市场2013年营收继续下降     [2013-12-11]
  45. 武汉服务器维修-服务器软硬件维护管理讲解     [2013-12-12]
  46. 武汉服务器维修-IBM天合应用服务器成为下一代应用服务器标准     [2013-12-12]
  47. 武汉服务器维修-中小企业服务器选购指南     [2013-12-13]
  48. 武汉服务器维修-惠普业绩超服务器市场预期致股价大涨     [2013-12-13]
  49. 武汉服务器我维修-绿色节能服务器电源选择指南     [2013-12-17]
  50. 武汉服务器维修-数据中心服务器创新发展之路     [2013-12-18]
  51. 武汉服务器维修-微服务器争夺云计算模式下服务器市场份额     [2013-12-18]
  52. 武汉服务器维修-低端服务器配置与选购     [2013-12-19]
  53. 武汉服务器维修-刀片服务器五大常见问题分析     [2013-12-19]
  54. 武汉服务器维修-2013年ARM处理器进军微服务器市场     [2013-12-20]
  55. 武汉服务器维修-云计算存储服务选择解析     [2013-12-20]
  56. 武汉服务器维修-ARM服务器未来出货量增长分析     [2013-12-23]
  57. 武汉服务器维修-服务器融合基础设施系统的现在和未来     [2013-12-23]
  58. 服务器配置使用误区和服务器配置正确使用-武汉服务器维修     [2013-12-24]
  59. 12项技术改变世界的未来命运-武汉服务器维修     [2013-12-24]
  60. 服务器容错技术五大高可靠秘密深度解密-武汉服务器维修     [2013-12-25]
  61. 大数据时代让服务器市场面临变革-武汉服务器维修     [2013-12-25]
  62. 服务器安全十二项保护热点技术讲解-武汉服务器维修     [2013-12-26]
  63. 服务器领域新时代开始降临-武汉服务器维修     [2013-12-26]
  64. 武汉服务器维修-虚拟服务器存储选择指南     [2013-12-27]
  65. X86服务器市场2012年调研报告详解-武汉服务器维修     [2013-12-27]
  66. 服务器云安全应用与发展-武汉服务器维修     [2013-12-28]
  67. 云计算对传统行业机遇和竞争-武汉服务器维修     [2013-12-28]
  68. 数据中心服务器两大关键潜在风险解析-武汉服务器维修     [2013-12-29]
  69. 服务器云计算数据中心的未来展望-武汉服务器维修     [2013-12-29]
  70. 武汉服务器维修-惠普存储未来趋势:存储即软件     [2014-1-2]
  71. 武汉服务器维修-服务器云计算和虚拟化安全问题应对指南     [2014-1-2]
  72. 武汉服务器维修-刀片服务器优缺点分析与应用详     [2014-1-7]
  73. 武汉服务器维修-服务器市场2014年新的发展趋势     [2014-1-9]
  74. 武汉服务器维修-全球2013年十大服务器宕机事件     [2014-1-10]
  75. 武汉服务器维修-惠普存储十年:HP 3PAR SteServ中端存储新品解析     [2014-1-13]
  76. 武汉服务器维修-惠普刀片服务器智能创新技术 数据中心首选产品     [2014-1-14]
  77. 武汉服务器维修-服务器虚拟化新一代特点详解     [2014-1-15]
  78. 武汉服务器维修-云计算环境下刀片服务器的优势应用     [2014-1-16]
  79. 【武汉服务器维修】服务器采购的五大问题分析指南     [2014-1-17]
  80. 【武汉服务器维修】微服务器市场2014年数据中心前景分     [2014-1-20]
  81. Window服务器与Unix服务器维护必备方法     [2014-3-3]
  82. 微服务器应用发展的十大障碍分析     [2014-3-4]
  83. 武汉服务器维修-VMware服务器虚拟化标准发展之道     [2014-4-16]
  84. 武汉服务器维修-全新惠普HP ProLiant DL580 Gen8服务器功能详解     [2014-4-17]
  85. 武汉服务器维修-服务器虚拟化技术助力数据中心创新发展     [2014-4-18]
  86. 武汉服务器维修-服务器配置软硬件升级指南     [2014-4-21]
  87. 武汉服务器维修-服务器虚拟化构建指南     [2014-4-22]
  88. 武汉服务器维修-服务器存储应用问题与改善指南     [2014-4-23]
  89. 武汉服务器维修-服务器整合五大新技术助力数据中心拓展     [2014-4-24]
  90. 武汉服务器维修-影响服务器升级的四大要素指南     [2014-4-25]
  91. 武汉服务器维修-刀片服务器配置选购详解     [2014-4-28]
  92. 武汉服务器维修-云计算性能特点与云服务器应用要求     [2014-4-29]
  93. 武汉服务器维修-如何实现服务器安全远程登录     [2014-4-30]
  • 新闻动态    ABOUT US
  • 联系我们   CONTACT  US
  • 电话:027 - 87879926/27
  • 销售:郑林海13871461410 QQ:847375387
  • 李涛13006344690 QQ:30688349
  • 商务:夏敏13720271753 QQ:280049000
  • 技术:李炎烽13016449841 QQ:233321544
  • 地址:武汉市洪山区珞狮南路147号未来城C座1502
  • E-MAIL:whintel@163.com

 

数据中心服务器两大关键潜在风险解析-武汉服务器维修

    数据中心服务器两大关键潜在风险解析-武汉服务器维修
    21世纪互联网时代,现代数据中心基础设施越来越复杂,各种刀片服务器、机架式服务器、塔式服务器,服务器机柜,存储,交换机,路由器,电源控制,UPS不间断电源等等,这一切的组件之间的依赖关系也更加紧密,数据中心管理员很难预先判断某一组件出现故障时会对全局造成何种影响。
    随着现代基础设施技术在性能上的不断攀升,其技术的复杂性与各服务器存储组件之间的依赖关系也变得更加紧密。这种变革一方面使IT部门的日常工作更加轻松高效,却也同时令故障更加难以梳理与排查——某些故障甚至可能需要经过数月甚至数年才被检测出来。
    过去,一套典型的企业数据中心可能包含多台服务器、某些机顶式及机底式网络交换机设备外加一些大型存储阵列。这类环境中各设备间的关联性显而易见:服务器的正常运作依赖于网络与存储机制的可用性。而网络与存储(及存储相关网络)则相对较为独立。
    如今,情况则完全不同。服务器虽然依旧存在,但刀片服务器和机架式服务器的广泛普及为我们带来内置融合型网络体系、且将局域网与存储的连通工作纳入其中。而存储机制则作为附加设备直接接入整个体系。除此之外,融合型网络的某些关键性功能还可能需要借助刀片服务器上运行的软件方可正常起效。更为复杂的是,如果使用基于IP的存储方案,即使是访问存储内容这样简单的诉求也需要涉及数据中心内的所有组件。
    大家很可能在尚未明确认知的情况下建立起这样一套环环相扣的循环依赖体系。如果运气不好,我们往往会在大量组件出现问题后才意识到设计中存在的严重缺陷。要想真正避免这种循环依赖性的出现,我们需要拿出大量时间阅读说明文档、通过图表理解设备的依赖关系,并通过严格测试验证自己的构思。
    数据中心真实案例
    尽管我在实际工作中已经见识过很多此类状况,但其中最具代表性的例子当数EMC VMware vSphere环境下的思科Nexus 1000V虚拟交换机。需要强调的是,我可算是软件定义网络的坚定拥护者。虽然软件定义网络尚不完美也称不上无法替代,但Nexus 1000V仍然是我所接触过的最强大的产品之一。不过虚拟方案与采用物理交换机存在诸多差异,而且它与大量外部及内部组件构成了严密的依赖关系。
    数据中心服务器两大关键潜在风险解析-武汉服务器维修
    在这次的实例中,vSphere主机配备有两块铜缆1Gbps网卡作为流量管理前端、另有两块传统(非nPAR/CNA)10Gbps网卡作为虚拟设备网络接入及访问业务环境中NFS存储的连通机制。
    对于不熟悉这款产品的朋友,我在这里做一点简单说明。Nexus 1000V由两大基本组件构成:虚拟监控模块(简称VSM)与虚拟以太网模块(简称VEM)。VSM充当模块化交换机中的监控模块,而VEM则作为接口卡。控制层与管理层由VSM实现,但数据层的交换工作则主要由VEM负责。
    从实践角度看,VMS被作为主机上运行的虚拟设备装置(作为高可用性需求下的可选次要装置)。VEM则作为软件模块被安装在每台主机上的vSphere管理程序当中。当然,VSM与VEM之间的通信也很重要,这是因为VEM只有在VSM的辅助下才能了解需要执行的任务以及具体配置方式。这中间显然存在强烈的依赖关系。另外,VSM与VMware vCenter之间同样存在强烈的依赖关系,后者的作用在于协调各vSphere主机之间的交互活动。
    一旦VSM与VEM之间无法完成通信,VEM也就失去了对流量的交换能力。而如果VSM与vCenter之间无法完成通信,用户对虚拟机网络配置进行的变更将无法生效(由双方同时触发)。相比之下,在外部搭配两台物理交换机就要简单得多,只不过虚拟化方案的可管理性更出色。
    在此次部署工作中,我还犯下了一些严重的错误——而且直到引发恶劣影响才被发现。那是一个假日,整套基础设施突然遭遇供电中断;虽然电力供应很快恢复,但技术人员发现很多组件明显无法正常工作。最终我们花了八个小时来定位故障原因并找出解决办法。
    最终我们将故障原因归结为两项关键性疏漏:追踪监控缺失与依赖关系规划不足。先说第一条,Nexus 1000V的任务是打理vSphere服务器上的两块10Gbps网卡——两块网卡还负责访问保存在存储设备中的虚拟机系统。我估计自己在部署时可能一时走神,导致在将Nexus 1000V VSM导入SAN存储后竟然忘了将其移动到本地存储当中。
    正因为在VEM未激活的情况下无法访问存储机制,所以VSM在停电后不能正常启动——反之亦然。直到调整之后,VSM才恢复了正常运作,而其它虚拟机也随着VSM的启动而陆续上线。
    上述问题解决之后(需要利用一些前端网卡来访问存储设备),整体情况仍未恢复正常。虽然vCenter虚拟机使用的是1Gbps网卡上的基本虚拟交换机(意味着与Nexus 1000V不存在依赖关系),但该虚拟机运行所必需的甲骨文数据库却无法脱离1000V独立起效。更糟的是,虚拟机由于包含有需要访问10Gbps网卡的生产用数据库而无法被迁移至1Gbps网卡这边。虽然只是为了快速使体系恢复正常而对配置做出临时变更,但数据库最终还是被迁移到另一套虚拟机系统当中。
    数据中心服务器两大关键潜在风险解析-武汉服务器维修
    与技术无关:两大关键教训
    此次事故给我和其他技术人员上了一课,大家意识到将Nexus 1000V部署在生产环境中实在很不明智。(顺带一提,只要将1000V与vCenter组件运行于二者的管理环境之外,以上难题根本不会发生。)不过在具体技术之外,我们还应该从中总结出一些更具广泛意义的教训——无论是否实际使用1000V交换机。
    第一条关键教训在于,我们需要有条不紊对配置部署加以严格检查、而后才能将其纳入生产环境——这一点非常重要。很多技术人员习惯于“知道了,过会儿就来处理”这类态度,但随着IT工作强度的日益增大、我们真有空闲回头对已经完成的工作进行重新审视吗?在这次事故之后,我会在每个项目中创建一份提示清单,借以提醒自己在项目后期切实将遗留问题逐一解决。如果做不到这点,我们很可能在项目中留下致命隐患、而自己却全不知情。
    第二项关键教训在于重视测试环节。在前面的案例中,我们本应该在实际投付生产之前对全局基础设施进行大规模停电及恢复供电测试(一旦进入正常运行,我们将无法根据需求随意关闭基础设施)。在很多人眼中,这种严格测试似乎是在浪费时间;但大家完全可以利用假期拉下电闸、再在下次上班时恢复供电,这不仅能够切实完成测试工作、而且也不至于给员工带来额外负担。
    归根结底,态度决定一切。尽管不少人认为IT部门在企业中的重要性已经被大大削弱,但身为技术人员、我们的小失误仍然会在基础设施复杂性与依赖关系日益增强的今天给全局业务带来严重影响。如今单一组件的作用远大于以往,一个简单的错误就能让整套基础设施陷入瘫痪。而随着数据中心基础设施边界融合趋势的普及,这种牵一发而动全身的难题将越发常见。
  • 版权所有© Copyright 湖北德众兴科技有限责任公司 地址:武汉市洪山区珞狮南路147号未来城C座1502
    联系人:郑林海 13871461410 鄂公网安备42010602000519号
    技术支持:武汉亿通天下科技有限公司
  • IBM    免费售后服务电话:800-810-1818
    HP    免费售后服务电话:800-810-3888
    戴尔    免费售后服务电话:800-858-0950
    联想    免费售后服务电话:400-100-6000