首页博客论坛产品大全报价中心评测中心DIY配件显示器笔记本手机DCDVMP3/MP4浙江IT黄页商家索引电脑城学院下载

今日导读

热点推荐

CPU频道

当前位置:CPU首页>评测 > CPU冷暖谁人知?CPU的温度监

CPU冷暖谁人知?CPU的温度监控技术解析

2005-10-04 15:50:52 作者:文三街在线 来源:天极 浏览次数:7008 文字大小:【大】【中】【小】
    前言:

  处理器功耗和温度随运行速度的加快而不断增大,现已成为一个不折不扣的“火炉”。如何使处理器安全运行,提高系统的可靠性,防止因过热而产生的死机、蓝屏、反复重启动甚至处理器烧毁,是处理器设计者所面临的最大问题。那么处理器厂商采取什么方法来降低热量来减少对CPU的损害呢?这时CPU温度监控技术诞生了……

一、外部温度监控技术—实现方便,可靠性不强!


  以前,我们对CPU温度监控只能通过“外部监测”措施—即通过主板CPU插座下面的热敏电阻来监测CPU工作时的温度。如果大家找一块KT266、KT400A之类的主板,往往就会发现CPU插座内中的立式或贴片式的热敏电阻。整个监测过程全面是由主板来负责,热敏电阻直接将所监测到的数据传给主板上的温控电路,如果监测到CPU的工作温度超过你在BIOS中的预设值时就会自动断电关机或报警、加快散热风扇的转速。

  采用此种方式的优点是体积小、价格低,使用方便,不过在监控处理器温度时明显存在缺陷。比如此类监测方式到的温度往往是CPU底面的温度,而不是内核温度,温度读数是由监控芯片根据温敏电阻的阻值变化计算得出,而且此类接触式测试受外部环境影响很大。如果热敏电阻与微处理器接触不够紧密,微处理器的热量不能有效地传送到,所测量温度会有很大误差。有些主板上采用SMD贴片热敏电阻去测量微处理器温度,其测量误差比直立式热敏电阻误差更大,因为这种贴片元件很难紧密接触到微处理器。故此类CPU温控结果误差性极大、反应不灵敏,所得结果仅仅只能作参考之用。

  这就带来了一个十分严重的问题∶表面温度不能及时反映微处理器核心温度变化,用专业术语说就是存在一个时间滞后的问题。因为核心温度变化之后要经过一段时间才能传送到微处理器表面。相比之下,表面温度反应十分迟钝,其升温速度远不及核心温度,当核心温度发生急剧变化时,表面温度只有“小幅上扬”。

  Pentium 4和Athlon XP等最新的微处理器,其核心温度变化速度达30~50℃/s,核心温度的变化速度越快,测量温度的延迟误差也越大。在这种背景之下,如果再以表面温度作为控制目标,保护电路尚未做出反应,微处理器可能已经命归黄泉了。也正因为如此,AMD曾在其白皮书中特地提出专门为Athlon XP处理器所制定、名为“Temperature Offset Correction”(温度偏差修正)的CPU内核心温度监测温度修正方案来纠正此种CPU温控所带来的偏差。

  所谓“温度偏差修正”就是指当系统采用外部测量法时,必须在测量结果的基础上增加一个温度偏差值:即BIOS中显示的温度值=实际测试值+温度偏差值。这个偏差值由主板热敏电阻、临界温度等因素来决定,当系统设定以后它就是一个常量(通过刷新BIOS可以改变这个值)。这样措施在一定程度上可以减小误差值。

  当然,问题仍不能得到根本性解决,比如对于突发事件(如风扇脱落)所带来的温度急剧提升完全不能及时做出反应。就目前来看,无论使用Intel还是AMD的微处理器,已很少使用热敏电阻测量微处理器表面温度了,所以BIOS与检测软件所显示的微处理器温度都是指微处理器的核心温度。

    二、第一代CPU内部温度监控技术—将热敏电阻移值入CPU内核

  针对外部温度监控技术的不足, 后来CPU厂商在CPU内核里面加入了一个专门用于监测CPU温度的热敏二极管,将CPU温度来引了“内部温控”时代。在这个,整个处理器温度监控系统可分为外部控制型和内部控制型两种基本结构。

  外部控制型监控系统,其实就是主板的温度监控电路,它有三种基本存在形式∶一种是采用独立的控制芯片,比如WINBOND的W83627HF、ITE的IT8705、IT8712等,这些芯片除了处理温度信号,同时还能处理电压和转速信号;第二种形式是在BIOS芯片中集成了温度控制功能;第三种形式是南桥芯片中集成温度控制功能,目前新一代南桥芯片都温度监控功能。而内部控制型监控系统则是指CPU内核心中整合的热敏二极管,这个热敏二极管的正负两极作为CPU两个针脚直接来通过主板CPU插座和主板的温度监控电路相连。

  在整个监控过程中,当CPU工作时,热敏二极管就将感应到的数据变化传输给主板的温控电路,由主板的一个特定逻辑运算电路通过所接收到的数据计算出CPU的内核温度,如果计算出来的温度高于预设温度警戒线时,系统就会自动在瞬间切断CPU核心电压,使CPU停止工作并让系统挂地起,从而可以很好地保护CPU不被烧毁。P2、P3及Athlon XP处理器都是采用了此种技术。

  当然,这种方法反馈回来的温度并不是很准确,往往要比CPU核心温度低5度左右。因此AMD又为防止它的处理器过热烧毁推出了S2K 总线断开技术:即当处理器内核温度过高时,系统会发出一个HALT指令((HALT 改指令的意思是在没有要处理的质量和数据时将处理器挂起,有点象休眠指令),当CPU接收到HALT指令时,处理器会转致相应的等待模式,这种模式下只要消耗较小的功率。为此AMD曾要求所有的AMD平台主板厂商通过支持S2K 总线断开技术的认证。

  可以说,通过在CPU内核整合热敏二极管来控温已经是一种能很准确监控CPU核心温度的方法了,而且配合主板的温控电路就能即时保护过热的CPU,使其不至于在CPU风扇突然停转或意外脱落时烧毁你的“芯”。但此类内部温控技术存在一个弊端,那就是在CPU温度过高时通过直接关闭电脑来达到保护的目的,这就会导成数据因为未能及时保存而丢失,要知道有时数据的价值往往要比一个CPU的价值要高。而且热量可能导致系统不稳定,如果电脑死机或程序进入死循环,就会失去监控作用,也就无法保护微处理器了。

    三、第二代CPU内部温度监控技术—热量控制电路,更具弹性化的监控模式!

  为弥补了第一代内部温度监控技术的不足,Intel在Northwood核心P4中引入了第2代内部温度监控技术—热量控制电路(Thermal Control Circuit,英特尔又将它命名为热量监视器(Thermal Monitoring))。

  与P3、Athlon XP内部仅拥有一个热敏二极管不同,Northwood核心P4的热量控制电路拥有两套热敏二极管。其中一套热敏二极管侦测CPU的温度值并传输给主板上的硬件监控系统,这套装置象传统的内部温控技术一样通过关闭系统来保护CPU,不过只是在紧急情况才会自动关闭。第二套热敏二极放置在CPU内核温度最高的部位,几乎触及ALU单元,也做为热量控制电路的一个组成部分。

  在CPU工作中,这两套热敏二极管的电阻会因温度而变化,因此通过它的电流也会随着CPU的核心温度而变化,通过与内设参考电流的比较,系统能够判断当前电流是否达到了临界点。如果CPU最热的地方超过一定值,第二套热量温控装置会发送一个PROCHOT#信号使热量控制电路系统开始工作,通过减小CPU的负载来降温,其实这套热敏二极管起到波动调节作用。

  在此前许多朋友认为这个热量控制机制就是Pentium 4在过热的时候减少了它的时钟频率,其实这个观点是错误的。以Pentium 4 3.2GHz为例, CPU的外频为200MHz,它乘与16的倍频就等于Pentium 4 3.2GHz。这个频率就是像WCPUid等软件所读出来的 Pentium 4的记号。这个频率决定了处理器的算术单元的工作效率。热量控制单元能够影响到这个频率。

  当温度正常的时候,ALUs(算术逻辑运算器)将会接受到3200MHz的频率。但当主板检测到CPU的核心温度达到一个特定的临界值时,热量控制电路就开始发送PROCHOT#信号,将空置的时钟周期插入到正常的时钟周期内,发送到CPU的调节信号如图表所示:

  结果,PROCHOT#激活的无效周期会将某些正常时钟周期省略掉,使得最终发送给CPU逻辑运算单元的信号频率就会有所降低,从而降低CPU的工作效能达到降温的目的。虽然主板和CPU内部的时钟发生器还是保持在3.2GHz,但是CPU的性能也会随着发热量的降低而降低。Intel声称说最终性能降幅可能达到30-50%之多,这主要取决于CPU的工作模式。

  随着温度的降低,热量控制电路将会开始减少空时钟周期的数量以使CPU返回它原来的工作模式。只要CPU核心温度比临界值低1度时,热量监视器就会停止发送过热信号。随后,热量控制单元就会停止产生空的时钟周期,CPU的性能也就恢复到3200MHz的正常值。这里有一个问题:什么温度值被定为临界值呢?当热量监视器与热量控制电路什么时候开始工作?

  其实,它对于不同频率的Pentium 4是不同的,Intel声称说每一个CPU集成的热敏二极管在的制造时候已经被校准了,并且一旦热量监视器的临界温度设定好以后就再也不能更改了。热量控制电路能够通过主板的BIOS或者用一个软件通过ACPI启用,如果它是通过软件启用的话,热量控制电路能够工作在“需求”模式。

  Pentium 4主板的BIOS中通常有“Processor speed throttling”之类的选择项,就是用来对选择超警戒温度后处理器任务周期(duty cycle)占全部周期的比例,这个比例越大说明处理器的工作效率越高。其中有“Automatic”和“On demand” 两种选择,可以调节比例在12.5% 到87.5%之间,选择的数值越小,则任务周期的比例越小,效率降幅也越大。

    小提示:PROCHOT#引脚的另一个功能是可以保护主板上的其他元件。PROCHOT#引脚采用双工设计—信号既可以从这根信号线出去,也能进得来。主板设计者可利用这一特性为供电模块提供保护,当供电模块的温度超出警戒温度时,监控电路输出一个低电平到PROCHOT#引脚以激活TCC,通过降低微处理器功耗来达到保护供电模块的目的。

  上图是演示有关热量控制电路工作时的典型图片:当温度升至82度,CPU性能大幅下跌,20-25秒左右就将CPU性能降至最低,整个过程中,CPU的性能大约降低了50%。由此推断,Northwood核心P4的Thermal Throttling全面开启的临界点在80℃。而当打开风扇后,Northwood性能上升与之前的下降一样,是阶梯式的改变。

    如果上面的防护措施并不能阻止CPU温度继续上升,那么当超过临界值时温控电路就会启动第一套热敏二极管:它就不再只是降低CPU的速度,而是发送了终结信号,从而关闭整个系统。由于热量控制电路是集成到CPU里面的和主板独立开来的,所以抗过热系统的反应非常快:温度的比较只需要十亿分只一秒。因此,当你把散热器从CPU移走之后,这个系统依然可以有效的保护你的CPU。

  值得注意的信息:Intel声称在温度达到135度的时候才会发出终结信号。不过,由于英特尔对0.09微米生产技术的电泄漏现象估计不足,导致Prescott内核的热量大大增加,在这种情况下第一代热量控制电路似乎显得有些力不从心了。因此,英特尔在Prescott核心中引入了第二代热量控制电路—Thermal Monitoring 2功能。

  Thermal Monitoring 2主要是在一代技术基础上增添了一个额外的电压调节机制,当温控电路侦测到CPU核心的热量超过某个界限时,温控装置就会发出发送PROCHOT#信号除低运行效率,同时自动将CPU的工作电压降下来,CPU核心的温度便不会超过限定值。

  从上图我们可以看出,当温度达到88度时,Prescott核心P4的屏幕截图操作之后也产生了性能波动曲线,这时Thermal Throttling的启动征兆。基本上来说,性能曲线还能够算的上比较平稳,但震荡幅度相对于Northwood来说要大的多。而当温度大约下降到83度时,由于Thermal Throttling的作用,性能的上升是呈明显锯齿状的,与之相比Northwood的曲线是相对较圆滑的。这说明第二代热量控制电路在调节方面更具弹性。

  可以看出,热量控制电路的优势非常明显,热量监测器及热量控制电路都是集成于CPU内部,与主板独立。通常,对于核心温度的检测和比较只需要极短的时间,这样在CPU风扇停转甚至脱落的情况下可以不用切断CPU的工作而让各种运行中的任务继续进行,不必担心未保存数据丢失的问题,损失的只是系统性能暂时下降而已,而且当CPU温度降下来以后,温控电路又会让CPU的实际工作频率恢复到设定频率值。

  小提示:如果你发现在某些情况下Pentium 4在超频时性能不升反降的原因—正是温控电路启动保护功能所导致的。从相关测试来看当Pentium 4的核心温度从70度升高到75度的时候,性能的损失将达到10%。

结语:

  从目前的温控技术来看,英特尔在温控技术暂时走在了AMD的前面,它最先进之处具有智能性,极大程度上保护了数据的安全性,而也这是温控技术的最大意义所在。不过,我们也应看到,现有的监控技术水平还远没有达到理想的状态,在温度测量精度、监控系统的及时性和降温技术的有效性等方面还有待提高……

设为首页】 【收藏此页】 【返回顶部】 【关闭

应用技巧