您是否注意到,灯泡(特别是白炽灯泡)似乎最常在打开的瞬间烧坏?或者像家庭影院系统或电视这样的电子元件,昨天还好好的,但今天打开时却坏了?我也遇到过。
您是否想过这是为什么?
热应力
影响电子设备寿命的因素有很多。最普遍的故障来源之一是热。事实上,大多数电子设备在执行其指定任务时产生的热量,正是缩短其电子寿命的热量。
当我在个人电脑时代初期在博卡拉顿的 IBM 工作时,我所在的团队负责维护各种类型的计算机和其他硬件。博卡拉顿实验室的任务之一是确保硬件极少发生故障,并且在发生故障时易于维修。在那里,我学到了一些关于热对计算机寿命影响的有趣知识。
让我们回到灯泡,因为它是一个容易看到,但并不常见的例子。
每次灯泡打开时,电流都会涌入灯丝,并使其温度从室温迅速升高到大约 340 华氏度(温度取决于灯泡的功率)。这会通过灯丝金属的汽化以及仅仅由加热引起的金属快速膨胀而产生热应力。当灯泡关闭时,热应力会重复出现——尽管程度较轻——在冷却阶段,灯丝会收缩。灯泡开关次数越多,这种应力的累积效应就越大。
热应力的主要影响是,灯丝的一些小部分——通常是由于细微的制造差异——往往比其他部分更热,导致这些点的金属蒸发得更快。这使得灯丝在该点更加脆弱,并且在随后的开机循环中更容易快速过热。最终,当灯泡打开时,最后一部分金属蒸发,灯丝在非常明亮的光芒中死去。
计算机中的电路与灯泡中的灯丝非常相似。反复的加热和冷却循环会损坏计算机的内部电子元件,就像灯泡的灯丝随着时间的推移被损坏一样。
散热至关重要
保持计算机凉爽对于确保其长寿命至关重要。大型数据中心花费大量能源来保持其中计算机的凉爽。在不深入细节的情况下,设计人员需要确保将冷空气 направлять 到数据中心,特别是 направлять 到计算机机架中,以保持其凉爽。如果可以将它们保持在相当恒定的温度下,那就更好了。
即使在家庭或办公室环境中,适当的散热也是必不可少的。事实上,在这些环境中,散热甚至更为重要,因为环境温度要高得多(这主要是为了人类的舒适)。
温度监控
可以测量数据中心以及各个机架内许多不同点的温度。但是,如何测量计算机内部的温度呢?
幸运的是,现代计算机在各种组件中内置了许多传感器,以实现对温度、风扇速度和电压的监控。如果您曾经查看过计算机处于 BIOS 配置模式时可用的一些数据,您可以看到许多这些值。但这并没有显示计算机在各种负载下的真实世界情况中内部发生的情况。
Linux 提供了一些软件工具,允许系统管理员监控这些内部传感器。这些工具都基于 lm_sensors、Smart 和 hddtemp 库模块,这些模块在所有基于 Red Hat 的发行版和大多数其他发行版上都可用。
最简单的工具是 sensors 命令。在使用 sensors 命令之前,使用 sensors-detect
命令来检测主机系统上安装的尽可能多的传感器。然后,sensors 命令生成输出,包括主板和 CPU 温度、主板上各个点的电压以及风扇速度。sensors 命令还显示被认为是正常、高和临界的温度范围。
hddtemp
命令显示指定硬盘驱动器的温度。smartctl
命令显示硬盘驱动器的当前温度、指示硬盘驱动器潜在故障的各种测量值,以及在某些情况下,硬盘驱动器温度的 ASCII 文本历史记录图。最后这个输出在某些类型的问题中尤其有用。
当与适当的库模块一起使用时,glances
命令可以显示硬盘驱动器温度以及 sensors 命令提供的所有相同温度。glances
是一个类似于 top 的命令,它提供了有关正在运行的系统的许多信息,包括 CPU 和内存使用情况、有关网络设备和硬盘驱动器分区的 I/O 信息,以及使用最多各种系统资源的进程列表。
还有许多优秀的图形监控工具可用于监控计算机的热状态。我喜欢 GKrellM 用于我的桌面。还有很多其他工具可供您选择。
我建议在每个新安装的系统上安装这些工具并监控输出。这样,您就可以了解计算机的正常温度是多少。使用像 glances
这样的工具,您可以实时监控温度,并了解各种类型的增加负载如何影响这些温度。其他工具可用于对您的计算机进行快照查看。
采取行动
针对高温采取措施非常简单。通常是更换有缺陷的风扇;安装更新、容量更大的风扇;以及降低环境温度。
在构建新计算机或翻新旧计算机时,我总是安装额外的机箱风扇,或在可能的情况下用更大的风扇替换现有风扇。最大气流对于有效散热至关重要。在某些极端环境中,例如对于游戏玩家,液体冷却可以取代空气冷却;我们大多数人不需要达到这种程度。
我也通常用大容量的 CPU 散热单元替换标准的 CPU 散热单元。至少,我更换 CPU 和散热器之间的导热硅脂。我发现工厂或电脑商店提供的导热硅脂并不总是均匀分布在 CPU 表面,这可能会导致 CPU 的某些区域散热不足。
我家车库上方有一个大房间,我和妻子用作办公室。总共有 10 台正在运行的计算机、两台激光打印机(大部分时间处于睡眠模式)、多个外部硬盘驱动器盒,每个驱动器盒有一个到四个驱动器,以及六个不间断电源 (UPS)。这些设备都会产生大量的热量。
多年来,我不得不使用几个窗式空调机组来保持我们家庭办公室的合理温度。几年前,我们的 HVAC 机组坏了,安装分区系统变得有意义,这样楼上的办公空间可以直接冷却,剩余的冷空气比楼下的暖空气密度大,会向下流动到较低的楼层。这对我很有效,并使我和计算机都保持在舒适的温度。
还可以测试散热解决方案的有效性。有很多选择,我喜欢的一种选择也可以执行有用的工作。
我在我的许多计算机上安装了 BOINC (伯克利开放式网络计算基础设施),我运行 Seti@Home 来用我拥有的所有原本浪费的 CPU 周期做一些有用的事情。它也为我的散热解决方案提供了一个很好的测试。还有一些商业上可用的测试套件,允许对内存、CPU 和 I/O 设备进行压力测试,这可以用作测试散热解决方案的额外好处。
保持凉爽,继续计算!
8 条评论