ZHCAEM5 October 2024 ADS1015 , ADS1115 , ADS112C04 , HDC3020 , INA180 , INA241B , INA280 , TMP275
随着服务器硬件不断突破计算性能的界限,对高效热管理的需求也不断增加。与传统的空气冷却相比,液体冷却能够更有效地散热,因此在数据中心中越来越受欢迎。但是,液体冷却系统会带来液体泄漏的风险,这可能会损害服务器组件(尤其是服务器卡)的运行和可靠性。本应用简报着重介绍泄漏检测技术、流量监控和压力检测。
由于液体具有较高的散热系数,因此与传统的风冷式系统相比,液体冷却方法可以显著降低服务器卡的温度并提高整体系统性能。然而,这些液冷式系统中的任何泄漏都会对硬件和数据完整性构成威胁。未能检测到的泄漏可能会导致短路和电气故障、服务器组件腐蚀、停机和数据丢失以及昂贵的维修和更换成本。
为了降低泄漏风险、保持服务器基础设施的高可靠性和正常运行时间,实施采用精密模数转换器 (ADC) 的泄漏检测机制至关重要。
可以采用多种泄漏检测技术来识别服务器卡和冷却液分配单元 (CDU) 中的液体泄漏。
电阻式泄漏传感器在数据中心中广泛使用。这些传感器的工作方式是检测传感器表面是否存在导电液体。当发生泄漏导致冷却液接触到传感器时,传感器的电阻会发生变化,并且 ADC(例如 ADS1015)会检测到电阻变化,这可能会触发警报或维护查询。有一些关键点需要考虑,例如泄漏传感器的放置,这些传感器应巧妙放置在服务器卡周围和潜在的泄漏点处(如液体连接器和管路接头)。正确放置有助于尽早发现超小的泄漏,以防止将来出现问题。传感器的灵敏度水平对于检测非常少量的液体同时尽可能地减少因冷凝而导致的误报至关重要。
ADS1015 和 ADS1115 等精密 ADC 器件采用易于使用的设计且尺寸较小,因此可采用独特的传感器放置方式。这些器件十分灵活,可以根据泄漏传感器的灵敏度接收各种信号电平。
图 1 显示了泄漏传感器建模的示例电路。泄漏传感器显示为可变电阻器,因为当检测到液体泄漏时,传感器的电阻会相应地发生变化。
服务器卡附近的湿度上升或温度突然变化可能表明存在潜在的泄漏。湿度传感器检测到湿度水平增加,这可能表明存在蒸发冷却液,进而指示系统中存在泄漏;HDC3020 等器件可以准确监测湿度,确保其保持在安全范围内。同样,可能的泄漏会导致冷却液溢出时温度显著升高,因此可以在服务器主板和 CDU 上使用 TMP275 等器件进行局部温度检测。这些传感器用作早期警报,在服务器机架发生物理损坏之前就泄漏或其他问题警告系统。这种湿度和温度检测方法最好与其他泄漏检测方法(例如基于电阻率的监测)结合使用,以实现全面的监控计划。
图 2 显示了在系统中正确使用 TMP275 来监控温度的示例。
图 2 用于温度监控的 TMP275有时需要高精度的温度测量来精确地控制冷却系统并更大限度地提高 CDU 的效率;可使用热敏电阻进行精确测量,点击此处可查看 TI 提供的一系列热敏电阻。电阻式温度检测器 (RTD) 是另一种精确测量此类温度的方法;PT100 是一种非常流行的 RTD,可以实现精确的温度测量。当使用 RTD 测量温度时,通常使用带有集成数模转换器 (iDAC) 的 ADC 作为电流源来激励 RTD,从而为 ADC 建立基准电压,如图 3 所示。这种温度检测方法可显著降低温度测量中的误差。ADS112C04 等器件可支持使用 RTD 对 CDU 进行非常精确的测量。
要了解如何设计使用 ADC 进行 RTD 测量,请参阅 RTD 测量基本指南。
图 3 用于 RTD 测量的 Δ-Σ ADC从汽车到服务器,所有液体冷却系统都在特定的液压范围内运行,以实现超高的效率和安全性。系统压力突然变化通常表示出现了问题,例如冷却回路中的泄漏、堵塞或高温事件。通过将压力传感器集成到液体管路或 CDU 中,可以实时检测液体压力的变化。这类传感器通常连接到自动控制系统,此类系统会在检测到泄漏时关闭流向受影响区域的液体,从而尽可能地减少液体泄漏造成的任何损坏。使用 ADS112C04 和 ADS1015 等器件可以精确测量模拟压力传感器或惠斯通电桥电路,如图 4 所示。
要了解如何使用 ADC 进行电桥测量设计,请参阅电桥测量基本指南。
CDU 中的液体流量监控至关重要,因为如果没有稳定的冷液体流量,元件和硬件可能很快就会过热并损坏。流量监控器有助于验证冷却系统是否高效运行,从而节省能源成本并延长设备使用寿命。监控流量还有助于识别泄漏、泵故障和其他问题。流速突然下降可能表示发生泄漏或泵故障;这两种情况对于液冷式服务器来说都很不利。通常,使用的流量计类型是模拟输出。因此,必须使用 ADC(如 ADS112C04、ADS1015 或 ADS1115)对其进行监控,这些 ADC 可以进行精确测量,从而验证流量是否得到准确监控并报告给系统控制器。
在其他几个区域中,传感器测量会在服务器机架或 CDU 中进行,例如冷却液储液罐液位、液体成分或泵监控。这些是可以在液体冷却系统检测到的一些其他参数,用于验证系统是否在规格范围内运行。通过监控这些参数,根据系统提供的信息安排维护和维修。通过额外的监控,系统可以在设计限制范围内运行,进而减少停机时间、系统故障和能耗,这意味着可以高效利用电源,并降低系统的运行压力。ADS1015 等器件通常足以用于 0 至 5V 范围内的这些其他监控应用。INA180、INA280 或 INA241B 等电流检测放大器可以监控泵电机的直流链路电流以提供额外的监控和保护,如图 5 所示。
在液冷服务器卡中进行有效的泄漏检测和传感器监控对于保持服务器系统的性能和可靠性至关重要。通过使用传感器、实时监控和预防措施,数据中心可以显著降低与冷却液泄漏相关的风险。通过启用泄漏、流量、压力和其他类型的检测,可以实现自动控制和通知,这些通知会直接发送给现场技术人员,以快速解决问题并减少服务器停机时间。采用多层面的监控方法可增强硬件故障防护,并建立高效且具有成本效益的数据中心运营。