人工智能和机器学习驱动的未来数据中心

人工智能 (AI) 和机器学习 (ML) 在其发展过程中继续取得长足进步,现在它们对数据中心运营和IT 管理产生了切实的影响。今天,我们看到 AI 和 ML 应用于从电源和冷却到资源管理和分配的功能。为此,我们已经看到数据和算法驱动的技术部署在快速故障检测/预测、根本原因分析、用电优化和资源容量分配优化等领域;所有这些都是为了确保数据中心尽可能高效地运行。

人工智能在行动

目前人工智能在数据中心的一项引人入胜的应用是检查机器人的使用。第二代机器人由人工智能驱动,无需人工干预即可自动更换任何故障硬盘。整个换盘过程——包括自动检测、故障盘定位、换盘、充电——可以快速、顺利地完成,换盘只需四分钟。

同样,基于机器学习的温度警报系统也已部署在数据中心,数百个温度传感器实时监控信息,并使用集成图模型快速准确地识别由于冷却设施故障引起的温度事件。生成的警报实时提供有价值的见解,并为数据中心的运营团队提供响应故障和避免任何潜在灾难所需的时间。

一个有趣的问题是,公司需要为数据中心管理开发自己的 AI/ML,需要什么样的数据类型和规模?这将取决于每个用例,但在开发 AI/ML 技术时,监控数据中心中的数据将是一个很好的起点。模型可以通过几个月的数据收集进行训练,采样率约为几分钟。一些现代数据中心设备已经提供结构化监控数据。

我们认为,建立一些监控数据格式的行业标准,有利于主要数据中心设备制造商遵循;反过来,这将加速 AI/ML 技术的采用。此外,数据中心运营商始终可以安装单独的物联网设备——例如简单的温度传感器或声音或图像收集器(摄像头)——以增强数据的多样性和维度,以实现更高级的人工智能功能。

鉴于数据中心挤满了机械和电气设备,一个问题是它们是否是促进信息和洞察力创建以及随后嵌入自动化系统的困难环境。为了解决这个问题,我们希望看到行业接受一些变化。这包括更容易接受主要的互联网技术趋势,并采用整体思维方式,转向软件控制的可编程性和灵活性。

例如,与传统的 DDC(直接数字控制)系统相比,PLC(可编程逻辑控制器)系统在新数据中心部署的背景下受到了更多的关注。这是由于它们的可编程性、快速响应、网络连接性和控制算法修改的灵活性。

人工智能和数据分析在数据中心规划和建设的早期阶段通常很有帮助,包括建筑信息模型 (BIM) 和建筑性能模拟 (BPS)。然而,并不是所有的建筑都是新的,所以很多人问人工智能/机器学习是否可以应用于现有设施,以及是否很难将人工智能/机器学习“改造”到现有运营的旧设施中。好消息是,始终可以安装外部数据收集设备(IoT 设备),将旧设施改造为 AI 驱动的环境。这是完全可行的,我们有成功实现这一目标的经验。

打造技术生态

事实上,正是在这个主题上,其他技术(如数字孪生和数据中心模拟)可以为数据中心设计和管理带来价值和洞察力。我们相信数字模拟能力对于可靠的数据中心管理至关重要,尤其是对于复杂和大规模的场景。由于这些设施的复杂性和现有服务出现意外故障的风险,通常无法在这些设施中进行真正的测试或试验。

因此,由数据和人工智能模型创建的数据中心数字孪生为运行新部署的实验或模拟操作行为以及预测复杂的故障场景提供了一个非常安全的环境。鉴于数据的规模和所涉及模型的复杂性,这是一个令人兴奋的研究领域,至少主要云提供商正在积极探索。

人工智能和机器学习驱动的未来

AI 和 DCIM 之间的相互作用也值得关注,看看两者是否会趋同,或者是否总会有一些分离,这将是很有趣的。就目前而言,我们相信人工智能技术将被集成到 DCIM 中,成为管理软件的重要功能,以提供增强的功能和操作可靠性。

鉴于数据中心的基本和重要服务性能——以及它们对大趋势的关键程度,例如将基础设施迁移到云——他们必须始终采用最新的技术和方法,以继续提供客户所需的服务。这就是为什么我相信数据中心将始终是许多技术的早期采用者,这些技术后来渗透到我们日常生活的其余部分。

(0)
上一篇 2022年3月28日
下一篇 2022年3月28日

相关推荐