迅维网

标题: 英伟达显卡门缺陷技术分析详解  [打印本页]

作者: 没你的城市    时间: 2014-2-16 21:30
标题: 英伟达显卡门缺陷技术分析详解 
1.显卡门事件回顾  
      NVIDIA在2008年7月初承认,部分G84和G86系列笔记本显卡的核心/封装材料组合存在瑕疵,如果核心温度变化起伏比较频繁,就可能会引发故障,出现多重图像、随机字符、纵横线条、没有视频信号等一种或多种现象。  
NVIDIA就显卡缺陷事件发表官方声明:  
  NVIDIA计划从第二季度收入中一次性支出1.5亿到2亿美元用来解决该问题,承担由此产生的保修、修理、退货、换货以及其它成本和费用。

2.封装缺陷详解:  
    这一问题说来奇怪,NVIDIA和AMD这一对竞争对手在GPU制造上依赖的都是台积电等台湾厂商,从代工工厂、封装工厂到所用工艺几乎完全相同。为什么单单NVIDIA的GPU出现问题,AMD却能够独善其身呢?要谈这个问题,首先需要从被AMD收购之前的ATI说起。当时由于在游戏主机中使用的GPU封装材料出现问题,再加上欧盟提出的RoHS环保条例开始限制半导体封装中的有害金属应用,ATI雇佣了NeilMcLellan专门主管封装工艺问题。从2005年开始,RoHS要求封装后的GPU在与PCB板焊接时采用无铅锡球(SolderBall)。趁这个机会,AMD也将GPU Die与基板封装时的所用的焊接凸点(Solder Bump)材料从高铅凸点转换为低熔点锡铅凸点。 [attachment=49204]      高铅凸点含有90%的铅和10%的锡,而低熔点铅锡凸点的构成是37%的铅和63%的锡。铅能够承载更多的电流,但AMD认为高铅凸点更易老化,在可靠性上有所欠缺。特别是在温度快速变化时,使用高铅凸点封装的GPU容易出现问题。出现这种情况的原因是,从硅晶圆上切割下来的GPU芯片与封装基板之间存在热胀冷缩率的差异,硅芯片为每摄氏度百万分之二,而封装基板为每摄氏度百万分之三十。这种差异导致温度变化时连接芯片与基板的凸点承受了相当大的拉力,久而久之就容易出现问题。     低熔点锡铅凸点避免了这种问题的发生,但它也有自己的缺点。比如,它的高电流承载能力不如高铅凸点,在出现高电流时容易出现电子迁移现象。由于GPU个部分有不同的功耗,因此经过有些凸点电流可能只有50mA,而有些凸点此时可能达到600mA。为避免电流过载,AMD在凸点和芯片之间增加了一层金属,重新对电流进行平均分配。     无论AMD还是NVIDIA的GPU,封装工作都是在矽品、日月光等厂商中进行的,不同厂商往往采用不同的工艺或材料。AMD在决定使用新的封装设计与材料后,将设计规范提供给封装厂商要求它们遵守。封装厂商方面,虽然愿意按照客户的要求进行制造,但他们并不对由此可能产生的后果负责。当然从现在来看,AMD使用的低熔点锡铅凸点工艺并没有出现什么问题。而且,新工艺制造成本更低,良品率更高。     反观NVIDIA,NVIDIA的移动GPU应当采用的是高铅凸点,在笔记本中使用温度经常快速变化,导致了问题的发生。而桌面版本虽然散热状况没有笔记本那么恶劣,但在长期使用后仍然不免出现同样的问题。     未来,RoHS规范将于2010年要求芯片制造过程中无论锡球还是凸点均要采用无铅工艺,AMD的一些客户甚至要求更早实现该目标。NVIDIA应当也已经付出了同样多的时间和精力来解决封装设计问题。

3.无缺陷版显卡芯片:  
      NVIDIA开始推销新版无缺陷笔记本显卡封装缺陷给NVIDIA的笔记本显卡带来了一场大麻烦,现在终于有彻底的解决方案出炉了。NVIDIA已经开始向OEM和ODM推销新的无缺陷版本。新核心代号“NB8E-SET”,又称“G84-751”,其实就是现在“NB8E-SE”使用新的日立底部填充剂后的改进版,规格方面并没有多大变化,比如核心频率625MHz、搭配128-bit 800MHz GDDR2/3显存等。         NB8E-SE在很多笔记本里都可以看到,常见型号有GeForce 8700M GT、GeForce 8800M GS、GeForce 9650M GS等。至于新版NB8E-SET会沿用旧型号还是换名字,NVIDIA没有透露。  以下是NVIDIA向其合作伙伴发去的通知:         “NVIDIA一贯致力于向我们的客户提供拥有尖端技术的优质产品,并不断改进产品质量和可靠性。为了在当前生命周期最后阶段提高产品质量、确保平滑连续的产品供应,NVIDIA强烈建议客户尽快地升级到最新版的NB8E-SET GPU。”这个最新修订版使用了日立的底部填充封装材料,能通过改进热循环可靠性提高产品质量、延长使用寿命。

      总结
从上文的NVIDIA发表的显卡缺陷技术文档中(出现这种情况的原因是,从硅晶圆上切割下来的GPU芯片与封装基板之间存在热胀冷缩率的差异,硅芯片为每摄氏度百万分之二,而封装基板为每摄氏度百万分之三十。这种差异导致温度变化时连接芯片与基板的凸点承受了相当大的拉力,久而久之就容易出现问题。)可以知道:导致花屏的原因,就是Underfill处,出问题是锡球“Solder Bump”和“Bump ad”之间的接触面“UBM”,也就是芯片内部的锡球出现了脱离基板的现象导致信号断路。  
       为什么带有封装缺陷的显卡芯片花屏后,当“脱焊”来加焊或者重值芯片,都可以暂时让显卡回复正常,但过一段很短的时间就会再次出现故障呢?因为无论是加焊还是重植显卡芯片,都属于高温作业,这个温度足以让芯片内部出现问题的小锡球“Solder Bump”熔化并重新接触到基板“Bump ad”,信号就回复通路了。但是,材料之间的热胀率差的缺陷并没有消除,所以会在正常使中再次出现同样的问题。  
       传统的民间维修行业,大都把此类缺陷芯片,当作正常的芯片脱焊来处理,导致故障反复发作,让前来维修的用户反复付费维修,既损害了消费者的利益,也影响了维修行业的声誉。  
  所以,正确的认识到缺陷芯片的原理,认识到原装设计的缺陷,采用有别于传统方式的改进型维修,对于维修方和被维修方,都是有帮助的。

作者: 没你的城市    时间: 2014-2-16 21:41
  这篇是我网上转载,编辑的。对大家维修显卡还是有帮助的,改变了我以前维修的误区,以为显卡门的显卡重植会比加焊用的更久。
   更重要的改变了以前一个误区,以为加焊是主板与显卡之间的锡珠脱焊了,其实是bga加焊温度让芯片内部出现问题的小锡球熔化并重新接触到基板,信号就回复通路了。但是,材料之间的热胀率差的缺陷并没有消除,所以会在正常使中再次出现同样的问题。
   所以还是更换升级版的才能根本解决问题。个人认为硅胶泥改铜片是必需的,风扇改常转没必要,太吵。
作者: letstone    时间: 2014-2-16 21:46
AMD的北桥还有显卡也有这样的问题
作者: userful    时间: 2014-2-16 21:47
这个都很多年以前的事情了。。往事重提。
作者: ﹏始終如1ゝ    时间: 2014-2-16 22:47
这对显卡门事件又有啦深入了解。。
作者: 一卒    时间: 2014-2-16 22:51
说这跟维修没意义
作者: 张劲松    时间: 2014-2-16 23:07
可以支持一下,按你的说法,让许多维修走出一个误区。原来以为是芯片和主板脱焊了,看来不是,那以后用风枪对着芯片吹,内部化了不就行了。
作者: htbcn11    时间: 2014-2-17 16:14
了解一下,很有意义。
作者: 葛林镇江    时间: 2014-2-17 16:46
这个业界早就知道,但不少维修还是照样加焊的
作者: ihyj    时间: 2014-2-17 18:43
这个发出来确实没用,
作者: 小飞2H    时间: 2014-3-10 16:34
对显卡加焊有了更深刻的认识!但有神马方法更好的解决重植返修问题啊……
作者: 威海一小彭    时间: 2014-3-10 16:45
说的挺好  没看明白
作者: 五岳之巅    时间: 2014-3-10 16:54
扩展一下知识面
作者: 佳成科技    时间: 2014-3-10 16:56
知道怎么修好就行了  嘿嘿




欢迎光临 迅维网 (https://www.chinafix.com/) Powered by Discuz! X3.4