找回密码
 加入网盟
分割线
官方精品推荐
今天这篇文章是想分享一个关于CPU温度的小知识,这个知识的价值在于,当你发现网吧卡了,却死活找不到任何软件异常时,可能得关注下服务器的CPU温度!
前不久处理过一个问题,当时的情况是CPU使用率基本维持在99%以上,但是又检查不到软件有任何异常!而且这种现象还随着时间不同而不同,但和上座率没直接关系!当事人几经纠结无果,后来找到我来研究这个问题。最后的问题结论是CPU温度过高导致的“卡”!
那么问题来了:CPU温度过高为什么会卡?温度到底达到多少才算过高?
1、CPU温度过高为什么会卡?
过去,CPU温度过高一般会触发自动关机保护,防止CPU烧毁。这也就让很多老技术形成一个观点,CPU温度过高(一般大于90℃)机器可能就容易死机了!
现在,CPU有了新的高温保护机制,就是本文案例提到的情况“自动降频”。现在市场上的CPU基本都有了这种保护方式,温度过高时,不再直接自动关机,而是先通过降频的方式,降低CPU处理能力,来控制温度的持续上升。如果温度还是继续上升,有2种可能:一种是机器已经处于假死状态,因为CPU频率降的太低了,请求处理不过来,看起来像假死,但可能ping得通,只是延时高。另外一种就是和过去一样,关机罢工!
而CPU温度过高之后的卡,也正是因为降频带来的。举个例子,正常频率处理一个请求可能只需要0.001毫秒,降频后同样一个请求可能需要0.1秒,从数学的角度来说,就相当于慢了100倍。能不卡么?
2、CPU温度到底达到多少才算过高?
首先,我们先了解CPU温度的2个指标:
T-case(外壳温度):指CPU外壳核心处温度;T-junction(连接点温度):指CPU与主板连接处的温度;
通常情况下,我们所了解到的温度基本都是T-case温度,而绝大多数情况触发自动降频或关机也是和这个温度直接有关;
那我们如何知道不同的CPU的T-case温度是多少呢?
Intel的CPU可以到http://ark.intel.com/zh-cn#@Processors查询。AMD的CPU目前还没找到可查询的官方资料,如果谁知道可贡献一下。
在ark.intel可以看到CPU类型分类,例如台式机,还是服务器,然后选择对应分类可以看到该分类下的CPU详细型号,找到你在用的CPU,然后找到T-case一栏,就是你的CPU达到多少℃会触发保护。
比如Intel® Xeon® Processor E3-1230 v2,它的tcase温度是65.8℃。
比如Intel® Xeon® Processor E5-2420 v2 ,它的tcase温度是76℃。
理解这篇文章的信息后,你将知道,CPU不是达到90℃时才会“出问题”,所以平时真心要注意服务器的CPU温度,避免向文中案例的情况,本来是个简单问题,实际处理了快1星期了仍然无果。
wxs.png

分享至 : QQ空间
收藏

0 个回复

您需要登录后才可以回帖 登录 | 加入网盟
关闭

华夏网盟推荐 上一条 /1 下一条