海兰信海底数据中心科普之可靠性篇
2022-08-15 14:47:45AI云资讯904
21世纪以来,人类进入开发海洋资源和利用海洋战略空间的新阶段,海兰信依靠海洋与船舶领域超20年的技术积累与沉淀,创新性的将海洋工程与IDC技术相结合,海底数据中心孕育而生。

早在2011年,美国互联网服务提供商AOL公司就宣布推出ATC的小型无人值守数据中心,称之为“熄灯”数据中心(Lights Out Data Center)。根据波洛蒙研究所的报告,人为错误是导致数据中心故障的罪魁祸首之一。更加糟糕的是,机房的部署环境虽然适宜人类工作,却不是设备运行的理想环境,其他相应的配套设施,也需要大兴土木,投资甚巨。
人力运维就像是把双刃剑,“熄灯”数据中心意在解决这个矛盾。随着技术进步和运维流程的革新,尤其是在世纪疫情的大背景下,“熄灯”数据中心的理念再次被提及,无人运维的理念逐渐深入人心。更可靠的设备,更精准的监控,更智能的自动化运维工具,让这一些都变得可能。

海底数据中心(UDC),就是这样一种免运维或少运维的数据中心部署形态。那么,海底数据中心又是如何保障系统的可靠性呢?
云服务的可靠性已提升到极致

近期,阿里云公布了最新的云服务器ECS服务等级协议SLA,单实例的可用性从99.95%提升至99.975%,多可用区多实例可用性从99.99%提升至99.995%,均为全球最高水准。99.99%的可用性,意味着云服务器一年内故障时间不超过52分钟,多可用区多实例则不超过26分钟。
阿里云是怎么实现这么高的可用性的呢?
首先是计算虚拟化层面的热迁移技术,它保证云服务器在发生故障时可以在用户无感的情况下,迁移到新的云服务器;其次,人工智能模型驱动的自动化运维平台,可实现高效的预防性维护,快速故障隔离,最小化影响面。
存储服务,其中云盘三副本,对象存储纠删码,基于合理的冗余和快速恢复技术,实现了99.999999999%(12个9)的可靠性和99.995%的可用性。
软件定义网络SDN技术已经非常成熟,部署在高可靠的物理网络设备上的Overlay虚拟网络,为业务提供了极大的灵活性和可靠性,远程运维更加更加便捷。
当用户把业务部署在云上时,就意味着将复杂的物理世界的事情留给了公有云厂商,系统的可靠性得到了保证。
后摩尔定律时代,服务器更耐用

1965年戈登·摩尔提出摩尔定律,距今已经过去近60年,芯片制程技术越来越接近物理的极限。
Intel CPU产品演进,从18个月的周期,延长到Tick-tock两步走的两年,又延长到三步走的三年。成本和时间的投入,相比CPU升级换代带来的算力提升,慢慢变得无足轻重。
可以预见,在更长的生命周期里,服务器提供的算力不会轻易遇到技术上的瓶颈,服务器更新的周期将更长,稳定性也将有所提高。
惰性气体环境,故障率低80%

研究发现,引起电子元器件故障的原因中,氧化占30%,温湿度变化占30%,其余为人鼠灾害。
在海底数据舱内,充满了惰性气体,消除了氧化风险;在20米以上深度的海水包围下,配合可靠的液冷散热技术,数据舱不会“中暑”,舱内环境近乎恒温恒湿。
在这样的环境下,服务器的各个元器件都工作在相对理想的环境下,可靠性和稳定性得到大幅提升。
根据微软海底数据中心项目的测试数据,运行在海底数据中心内的服务器,故障率仅为陆地数据中心服务器的1/8。

最近国外IT大厂又出圈了,Oracle和谷歌在伦敦的数据中心,因为高温天气冷却系统出现故障,进而导致机房故障!运维的同学真是操碎心了,想来还是下海吧……
相关文章
- 数据中心联动光储业务!这家企业走出不一样的破局之路
- 从传统数据中心到现代化数据中心,四个决定性的改变
- Aginode安捷诺与比利时绿色技术公司 Ethernetics联手,推出智能PDU,助力数据中心单机架能效提升
- 英伟达称其AI数据中心采用高温运行设计,可大幅减少用水量
- SpaceX AI1发布背后:太空超算/数据中心正从概念走向工程现实
- 数智普惠 一步到位 | 华为极简全闪数据中心2.0存储商业峰会-暨大附一院样板点发布会成功举办
- 数据中心耗电远超电网负荷,迫使英伟达与谷歌在2026年第三季度前启动800V直流电架构改造
- 亚马逊数据中心公布2025年水消耗量为946万吨
- 信然与迪拜客商达成意向合作 助力40亿美元海外算力数据中心项目
- 伊顿电源Power Cube电力模块,打造数据中心高密度供配电新标杆
- 快部署、易扩容、智运维:科士达预制模块化数据中心重塑AIDC建设范式
- 从冷源到算力:美的楼宇科技在马来西亚展示数据中心“终极冷却”矩阵
- Anthropic每年向埃隆·马斯克的数据中心支付150亿美元以获取使用权限
- 思瑞浦 AI 数据中心全栈模拟芯片方案,构筑坚实智算根基
- 戴尔科技重新定义现代化数据中心,引领智能时代
- 小科堂丨科士达铅酸蓄电池:“7大维度” 安全保障,为数据中心备电站岗
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









