迅维网

查看: 2224|回复: 12
打印 上一主题 下一主题

CPU 真的会老化?具体表现是什么?

[复制链接]
跳转到指定楼层
1#
发表于 2018-5-14 20:16:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自: LAN 来自 LAN

马上注册,获取阅读精华内容及下载权限

您需要 登录 才可以下载或查看,没有帐号?注册

x
CPU 真的会老化?具体表现是什么?

2#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
真奇怪了,怎么一个个都在谈论electron migration?好歹也做过相关领域研究的答一个吧。

一般来说IC老化是四种现象之一:NBTI (negative-bias temperature instability), HCI (hot carrier injection), EM (electron migration) 和TDDB (time-dependent dielectric breakdown)。其中NBTI和HCI主要导致速度的缓慢降低,EM和TDDB主要导致随机的崩溃性失效。
其中EM很好解释,金属导线中的原子被电流带着不知跑到什么地方去。这个效应一会导致导线在缺损处逐渐变细最终断裂,二会导致跑掉的原子在别处堆积生成dendrite,然后dentrite长着长着就长到别的导线上面去了,结果就是线间短路。可以看出两个效应基本一发生就没得挽救了,要对付EM主要靠预防,比如说想法不要造出缺陷来,做线的时候宽一点。但是在设计条件下,正常设计数十亿门,导线如恒河沙数,要保证这个人力有时不及。
其它三个效应都是跟MOSFET原理有关。贴个我以前做的报告图示意一下:

本科学过电子学的可以知道,MOSFET原理是一个门极靠静电势控制底下的导电沟道深度,电势高形成深沟道电流就大,电势低沟道消失就不导电了。稍微想深一层就知道这个门极导电底下的沟道也导电,那就必须中间有个绝缘介质把他们分开,否则就变成联通线不是晶体管了。
再想深一层就知道这个绝缘介质最简单的做法是把硅氧化做二氧化硅。
而行外人一般想不到的是光二氧化硅还不够,工程上二氧化硅和基板硅之间附着很差,必须加入Si-H键把二氧化硅层拴住。所以实际上介质层和硅之间有一层不是纯SiO2是SiOH。问题由此产生。
VLSI等级的微观尺度使得量子效应不能忽略。沟道中流动的电子会因为量子能量涨落随机得到临时能量变成热电子然后跳到不知什么地方去,这叫隧穿效应。随手搜到一个详细解释(隧穿电流_百度百科),对物理学感兴趣的同学可以看看。不感兴趣的同学,想想MOSFET关断状态的漏电流哪来的,为啥是个幂指数函数就知道了。
这事没完。前面提到有Si-H键。这个键的特点是容易破,也容易重新恢复。电子一隧穿,有几率把这个键打断,这时候就产生断键和游离氢原子。断键会使得threshold voltage提高,就是说原先0.3V就打开的门,现在需要0.35V才能打开了。这意思是说,同样加1伏电压,原先导通电流相当于0.7V时的情形,现在相当于0.65V时的情形。这就是为什么断键会使芯片变慢,因为导通电流低了,升压就慢。升压一慢,门开关就慢了,最后你的逻辑就慢了。
为什么会随时间变慢呢?因为断键是随机发生,需要时间积累。另外,记住我们前面提到Si-H键可以恢复,所以基于断键的老化效应都有恢复模式。对于NBTI来说,你给他加反向电压就会进恢复模式;对于HCI来说,你不要动他就进入恢复模式。但是这两者都不可能长时间发生,所以总的来说,芯片是会逐渐老化的。
为什么温度有影响呢?温度表示宏观物体微观粒子平均动能。热了,热电子就多,断键机会就大。一般民用电子产品用上十来年问题不大。汽车电子芯片,十年就差不多了。哪位有朋友开美国车的,可以观察一下。新车一般很潮,上十年以后基本上就像圣诞树一样了,一开车到处都亮。
为什么加压有影响呢?同样的晶体管,供电电压越高偏移电压越高,偏移电压越高氢原子游离越快,等于压制了自发的恢复效应,自然老化就快了。
为什么超频有影响呢?因为超频本质上是利用芯片厂商对这个过程无法充分把握而预留的裕量。芯片制造出来会有一个速度测试,然后芯片厂商考虑到典型使用情况,预留一个裕量,话不说太满,免得老化以后芯片达不到。打个比方,300ps芯片标3GHz,即便老化10%也还能达到;但是如果你改时钟当3.3GHz用,那稍微老化一点就达不到了。从用户的角度来看,就是亮不起来。
这是为啥会老化。最后再说一下前面提到的TDDB。上文只说Si-H键会断,但是Si-O键其实也会断的,断了以后会形成一个可导电的点。随着使用随机断裂,到一定时间以后断了的Si-O键会形成一个从沟道联通门极的导电旁路,管子就击穿了。这就是TDDB。过去为了速度二氧化硅层越削越薄,这个问题很突出。但是有了High-

                               
登录/注册后看高清大图
金属门(HKMG)技术以后可以不再削薄电介质层,这个问题可能就不如想象的那么严重了。
延伸阅读:
Negative-bias temperature instability
Hot-carrier injection
普度大学M. Alam教授的网上课件EE695A:  Reliability Physics of Nanoelectronic Transistors。 特别推荐这个,Alam教授不辞劳苦不怕被盗把幻灯片都放上来了还带配音,尤其难得的是把NBTI研究历史都带入教学里面了很有故事感,数理背景hold得住的不妨看一看。
上面图中右上角黑白图取自Alam教授课件,此致感谢。

回复 支持 反对

使用道具 举报

3#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
老化也叫wear out,它并不会影响计算速度,但在一定时间后会造成出错。超频伴随的高温和高电压会加速这一老化过程。因为睿频技术超过TDP不会太久,一般来说影响不大。我们先来看看CPU的寿命是如何决定的。
浴缸曲线模型(Bathtub Curve Model)

和大多数半导体设备一样,CPU的可靠性我们可以通过失效率来衡量。如果我们以时间为x轴,y轴为失效率。CPU的失效率曲线如下:

失效率曲线
蓝色的曲线叫做早期失效期(Infant Mortality),表明CPU在开始使用时,失效率很高,但随着产品工作时间的增加,失效率迅速降低。它的原因是由于制造和原材料带来的缺陷。
红色的直线叫做随机失效期(Random Failures),它是质量缺陷、材料弱点、环境和使用不当等因素引起的。它是个常数,它在CPU整个生命周期是个常数。
绿色曲线是耗损失效期(Wear-out),它在前期极低,后期开始错误后极具提高。是老化失效的原因。
综合上面三种曲线,综合失效率是紫色曲线,它呈现两头高,中间低的特征,形状像个浴缸,我们把它叫做浴缸曲线(Bathtub)模型。CPU在生命周期中的这种特点,表现在开始时故障率很高,如果没有问题,则可以稳定工作很久,到最后开始老化失效,故障率急剧升高。
Burn-in

许多人看到这里都会大吃一惊:“什么,CPU早期失效率这么高?是不是我刚买的CPU马上就要坏了?”CPU制造厂商并不希望大规模的退货发生,毕竟所有CPU至少都有3年的质保期。CPU厂商会封测期间,把CPU放入高温的环境下洗个澡(heat soaking),并加上高压。这样几个小时就相当于过了好几周。在把CPU拿出来测试,不好的淘汰掉,好的就可以进入浴缸曲线的底部稳定期,才能出货。这个工序叫做老化(Burn-in)。如图:

这样挑选后CPU直接跳过早期失效期,进入了稳定期。大家的CPU才会有3年质保。
3年之后呢,CPU会降速吗?

就像超市里的牛奶写的保质期3天,实际上5天之后大多数牛奶还是可以喝的一样。3年质保只是最小值,实际上大部分CPU用上7年以上都是没有问题的。那么多年后进入耗损失效期(Wear-out)后CPU会怎么样呢?首先,CPU的速度是恒定的,都是一个基频乘以一个比例(Ratio)出来的。基频现在Intel CPU一般是100MHz,我们用的3G CPU,Ratio就是30,下来刚好3GHz。而基频和Ratio在整个生命期是不变的,从而CPU运算速度是不变的。Wear out的后果是出错而不是降频,而很多种出错都会被CPU的错误检测发现并报告或者纠正,详情请参阅本专栏的另一篇文章计算机硬件出错了会发生什么?,如果发现出错,就是CPU开始进入失效期,以后错误会越来越多。
CPU为什么会失效?

实际上CPU失效的原因有好几个,我们今后会专门撰文介绍。它们的统一特点就是高温高电压会加速失效。如图:

失效与电压的关系(来源anandtech)
粉色的曲线是高温曲线,黄色是正常温度,而蓝色则是配备了好的散热系统。可以看出高温和高电压严重影响了CPU的失效率。这也是为什么超频后不再享受质保的原因。
结论

CPU使用长了并不会降频,如果我们把电脑和手机变慢的罪魁祸首归咎于CPU,那真是错怪它了。那么为什么电脑手机会越用越慢呢?原因很多,软件原因是安装软件越来越多等等;硬件原因也许就是风扇脏了,转速慢了,造成温度过高而降频(CPU风扇停转后会发生什么?CPU凭什么烧不坏);或者SSD的空间满了/没有启动Trim(杂说闪存番外:手机为什么越用越卡和闪存写放大)造成速度极大降低等等。
最后强调一下CPU的Wear-out是随着使用时间进行的。如果你把电脑放上几年不动,CPU并不会老化,反倒是SSD的内容丢失了(杂说闪存番外:我们的数据存在固态硬盘上安全吗?)
其他CPU相关文章:
CPU制造的那些事之一:i7和i5其实是孪生兄弟!?
CPU制造的那些事之二:Die的大小和良品率
为什么CPU的频率止步于4G?我们触到频率天花板了吗?
为什么晶圆都是圆的不是方的?
为什么"电路"要铺满整个晶圆?
欢迎大家关注我的专栏(UEFI和BIOS探秘)和用微信扫描下方二维码加入微信公众号"UEFIBlog",在那里有最新的文章。同时欢迎大家给本专栏和公众号投稿!

用微信扫描二维码加入UEFIBlog公众号

回复 支持 反对

使用道具 举报

4#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
泻药,粘一个答案充数:
温度高会造成芯片的电子迁移现象,加速芯片设备的老化。“电子迁移”是50年代在微电子科学领域发现的一种从属现象,指因电子的流动所导致的金属原子移动的现象。因为此时流动的“物体”已经包括了金属原子,所以也有人称之为“金属迁移”。在电流密度很高的导体上,电子的流动会产生不小的动量,这种动量作用在金属原子上时,就可能使一些金属原子脱离金属表面到处流窜,结果就会导致原本光滑的金属导线的表面变得凹凸不平,造成永久性的损害。这种损害是个逐渐积累的过程,当这种“凹凸不平”多到一定程度的时候,就会造成CPU内部导线的断路与短路,而最终使得CPU报废。温度越高,电子流动所产生的作用就越大,其彻底破坏CPU内一条通路的时间就越少,即CPU的寿命也就越短,这也就是高温会缩短CPU寿命的本质原因。

——————
没做过测试,不过自己有个赛扬II的CPU 2.4G,用了好些年了,现在这台电脑开机就显示CPU100%,永远90%以上,没超频,XP+金山,后台很干净,纯粹是那它跑DOS模拟器的。
不知道是不是CPU老化了

回复 支持 反对

使用道具 举报

5#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
CPU/GPU跟人都一样,也是会老化,物理上称为“电子迁移”,关于其解释可以看 @Kaiser Li。
造成这种“电子迁移”有4个原因,
1.长期高负载状态下使用(例如超频)
2.长期高温环境下使用   (散热不良)
3.长期电场不稳定环境下使用
4.常规使用了很久、很久、很久...
这种老化不会影响到标准的计算规格与速度,但是会影响到超频的性能。
至于@Kaiser Li所描述的那个赛扬II的CPU 2.4G开机100%的,请检查系统、内存、硬盘、温度这些环节。

至于“Intel 那酷睿系列处理器的睿频技术不就会加速CPU的老化么?”
不会的。
请先看看它的工作原理
“睿频加速技术使得cpu的主频可以在某一范围内根据处理数据需要自动调整主频。它是基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智能地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响CPU的TDP情况下,能把核心工作频率调得更高。比如,某i5处理主频为2.53GHz,最高可达2.93GHz,在此范围内可以自动调整其数据处理频率,而此cpu的承受能力远远大于2.93GHz,不必担心cpu的承受能力。”

以某I5为例,标称的主频是2.53GHz,通过加速技术后,最高可达2.93Ghz。
再反向推敲,如果它默认频率、TDP设定就是2.93GHz,然后把它的主频调节到2.53Ghz 呢?

回复 支持 反对

使用道具 举报

6#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
会老化,但是以目前的工艺条件看,一般你等不到那一天= =b

回复 支持 反对

使用道具 举报

7#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
CPU无法达到原来频率或者达到同样的频率需要更高的电压,俗称“缩缸”,超频或调节电压会加速这一过程。
相关说明:【转帖】有关“电子迁移”和超频的关系_amd吧

回复 支持 反对

使用道具 举报

8#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
看了各位的回答,都是比较专业的,说的都很对,我从我日常维修的角度,肤浅的回答一下这个问题,看看都有什么问题会导致CPU老化。
1.你的CPU散热系统会老化,风扇轴承常年旋转缺油,轴承脱口,导致的你风扇转速变慢,甚至不转,散热片集满满是油污的灰尘,风扇死命的吹,也不会让CPU得到一丝凉风。
2.你的主板会老化,主板的老化会极大地影响CPU的供电,主板老化后自身元器件的过热也会影响整机及cpu的温度。
3.电源会老化,它会先让主板加速老化,再迅速的影响cpu。

计算机是仿生学的产物,当你的cpu不行的时候,实际上是你的很多配件老化的综合结果。尤其在这个阶段,个人电脑升级换代的需求小了,很多人都还可以用自己的老电脑凑合着上网,7,8年都不换了,打开你的机箱看看里面的环境,它们能不老化吗?搁谁谁受得了呀。
还有,北方风沙大雾霾重,尘土积累非常迅速;还有有的使用者靠窗户,靠厨房,这些灰尘油烟颗粒都会加速你机器的老化,让你的CPU老化速度加快。

一般的使用者是没有能力来保证自己的使用环境和定期维护清理的,在购买之前,在主板和电源这2样东西上舍得花钱,可以极大的延长整机寿命,也是各位不多的能做的事情了。

回复 支持 反对

使用道具 举报

9#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
老化不影响计算速度,但是会影响超频性能。具体表现是提升频率需要的电压越来越高。

回复 支持 反对

使用道具 举报

10#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
会的。先上一张老CPU图


奔腾MMX 233,第一台自用电脑的cpu,还在使用中。估计比这里不少小朋友还要老一点(瞬间暴露年龄-- 手动捂脸)

具体表现?所有的针角已经被岁月磨平,边角也已经圆润,没有了当年的棱角,把玩起来完全不会有扎手的感觉。唯一的遗憾是正面的字迹早已消失,看不到当年Pentium MMX 那烧包的商标了
当年的风彩应该是这样的(图片来自网络):



总的来说,作为钥匙扣,还是越来越好用了。

回复 支持 反对

使用道具 举报

11#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
数字电路包括CPU的老化并不是性能指标逐渐降低,而是某天突然有某个器件失效导致整个电路无法工作。但是,失效前性能跟刚出厂时是一样的,这是所有数字电子产品的特点。如果你觉得慢,那是因为新软件和软件垃圾积累导致的。
可靠性设计有两个最基本指标,一个叫“平均无故障时间”和另一个叫“首次故障时间”。对IC来说,首次故障就会导致报废,因为无法维修。
再说一下超频会影响寿命,其实是因为此状态会导致CPU无法及时散热,本来是温水泡脚变成了开水泡脚,会导致器件加速老化,注意是加速。器件老化速度跟器件温度是指数关系,超频三年坏了了CPU,如果不超频用几十年降频用上百年都不稀奇。
再说一下模拟电路和动力机械的老化。坦克发动机是小马拉大车,其正常工作状态就相当于同体积民用发动机的超频状态,工作百来个小时就要换发动机热部件,车里热量散不出去跟火炉一样。所以坦克在投入作战之前要移动位置必须靠火车和拖车。类似的还有无线电台发送端的功率放大器,也是工作在“超频”状态,不过它不是突然失效而是工作指标慢慢恶化。

我国古代晋朝时有个太后,叫贾南风,她丈夫有句话很出名,“何不食肉糜?”。贾太后有个爱好,非常喜欢小鲜肉,经常派手下到长安或洛阳城里乱转物色身强力壮的男青年进宫谈心,一两个星期后被贾太后教育得气若游丝的男青年就被衣衫不整第随便扔到城外路边。这些天里,这些小鲜肉就是工作在超频状态,严重磨损,工作寿命剧降。

回复 支持 反对

使用道具 举报

12#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
这个我碰到过,已前公司有一台老电脑只要不开大的程序过几秒钟必死机,不停的用让cpu保持二三十的使用率就一直正常,硬件系统折腾换个变没用,后面只好写个死循环的程序开机启动就行了。

回复 支持 反对

使用道具 举报

13#
发表于 2018-5-14 20:16:22 | 只看该作者 来自: LAN 来自 LAN
电脑用久了变慢了,最主要原因不在于CPU或其它硬件的老化,而是软件的应用要求越来越高,软件的升级运行得越来越大,越吃CPU,内存。这是计算机硬件淘汰得很快的最主要原因了。如果10年前的一台电脑,里面的软件从没升过级,假设一直保持不变,到今天,和10年前使用效果,速度一样。

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表
附近
店铺
微信扫码查看附近店铺
维修
报价
扫码查看手机版报价
信号元
件查询
点位图 AI维修
助手



芯片搜索

快速回复