迅维网

标题: HM55平台0.3~0.53A掉电维修经验小结 [打印本页]

作者: xueflyer    时间: 2013-4-14 19:47
标题: HM55平台0.3~0.53A掉电维修经验小结
本帖最后由 xueflyer 于 2013-4-14 20:32 编辑

HM55平台0.3~0.53A掉电维修经验小结
2013.04.12
    由论坛的维修贴来看,“HM55平台主板0.30.53A掉电”的故障很多朋友都修到过了。引起这种现象的故障原因多种多样,比如缺电压、时钟异常、CPU供电电压异常、PCH芯片不良、空焊等等。
正是因为一种现象对应的故障原因太多,造成了维修中对故障点判断的困难。如何缩小故障范围,最终确定故障点呢?有没有一种大致的维修思路和方法呢?
这就是今天发这个帖子打算尝试的。希望找到一种通用的、适用于全部或者绝大部分HM5X平台主板的维修方法。
因为个人的局限,可能有很多错误认识或误将个例当做了通病的问题,请大家指出,一起讨论,将这个经验小结共同完善补充,让其更接近维修实际。
这里,以LL7主板为例,首先列举相关维修记录。之后再对其进行归纳总结,试着得到一个适用于所有或者绝大部分HM5X平台主板的维修方法。
第一部分:故障点分析

LL7主板0.30.4A掉电---故障点整理
前提:空板触发电流正常LL70.06A左右);加上CPU后触发0.30.4A掉电。

LL7为广达生产的主板(联想Ideapad Z360/G360) ,HM55芯片组,双显卡。

未完,接下页


作者: xueflyer    时间: 2013-4-14 19:50
本帖最后由 xueflyer 于 2013-4-14 20:30 编辑

LL7为广达生产的主板(联想Ideapad Z360/G360 HM55芯片组,双显卡。
归纳一下“触发后0.30.53A掉电”引起的故障点,大概有15种之多,归纳成表格如下:
整理表1.jpg
登录/注册后看高清大图

分析:
1.  缺电压+VGACORE_IGPU+1.5V_SUS,导致触发后0.30.53A掉电。   这两个电压对应的PG信号都属于HWPG的组成部分之一。电压未产生,芯片也就不会发出PG信号,导致HWPG0V   EC芯片接收不到HWPG会关断S5ONSUSONMAINON信号导致掉电。
    HWPG的组成电压远不止这两个,在以上表单中未出现,主要是因为:缺其他几个HWPG组成电压时,空板开机电流会明显偏大或偏小,比较容易发现问题,立即维修。所以并不把它们归于“装CPU后,触发后0.30.53A掉电”类故障。 这也是前面要强调的“前提:空板触发电流正常LL70.06A左右);加上CPU后触发0.30.4A掉电。”的原因。
    因此,将缺电压+VGACORE_IGPU+1.5V_SUS故障归为“HWPG”类。
2.  HWPG未产生或短路。     “缺HWPG”类
    除了前面提到的缺电压导致HWPG为低电平外,这里指的是电压已经产生,其电源管理芯片部分不良导致的PG不发出(即HWPG为低)的情况。HWPG信号本身测到短路,其信号当然也不会起来。
3.  缺电压部分还有:“+3V_SUS+5V_SUS未产生”和“+1.5V没产生”两种。    +3V_SUS+5V_SUS+1.5V都不参与HWPG的产生。如果只缺这几个电压,HWPG仍会照常产生。那它们通过什么途径引起了0.30.53A后掉电呢?
+3V_SUS+5V_SUS中主要是+5V_SUS起了作用,它主要给VRM芯片提供工作电压。当这个电压完全没有时,此时EC芯片仍是发出了VRONVRM芯片,但芯片没有工作电压,无法产生VCORE电压,引起掉电。   
因此将“+3V_SUS+5V_SUS未产生”故障归为“VRM芯片无供电”类。
    另外得提一下,当+5V_SUS产生不足,比如只有+4V左右时,故障现象为:电流0.35A左右保持,不掉电。这显然不属于我们今天讨论的范围了。
     那么,还有个“+1.5V没产生”。       在这块板上,+1.5V主要就是给时钟芯片提供工作电压的。它没有会导致时钟晶振14.318MHZ不起振。   
因此将“+1.5V没产生”故障归为“时钟异常”类。
4.   对于“时钟芯片部分工作异常”,除了上面提到的缺+1.5V工作电压,还有很多故障点,比如缺开启信号、晶振损坏、时钟芯片损坏、时钟已产生但没有送到PCH芯片等等。就因为时钟电路是一个独立的电路,包含较多的周边元器件,所以故障率也较高。   
将此归于“时钟异常”类。
时钟异常,导致触发后0.30.53A掉电”本质上讲是PCH芯片缺时钟信号,PCH拉低SLP_S3#SLP_S5#信号强制关闭电压的一种保护机制。命令由PCH发出,最终执行还是靠EC            
这与EC没收到HWPG信号时的动作过程是不同的:缺HWPG时,可能是由EC直接发出关闭电压命令并执行,PCH并不参与。
5.   PCH芯片不良”指的是芯片损坏、空焊等几种情况。
6.   H_PWRGOODCLK_CPU_BCLKPLTRST#PCH发给CPU的最后几个时序信号,CPU缺少任意一个都会导致掉电。CPU是通过什么信号或方式通知PCH芯片让其强制断电的?这个我以前没有思考过,欢迎大家发表各自的见解,讨论一下!
7.  最后4种:“电感PL13撞件,VCORE电压功率不足”、“ CPU座空焊 DMI总线不通”、 独立显卡的供电电压全部短路”和“PCH-BIOS芯片,EC_BIOS芯片不良”,因为维修中极少见到,我将其归于个案,仅做为补充。
    将前面的分析简单小结一下。
似乎可以将“触发后0.30.53A掉电”的故障原因分作三个大的方面:
1.        HWPG信号没有+3V
2.        PCH的三大条件中缺供电、时钟;
3.        CPU的三大条件中缺供电、时钟、复位。
注:PCH缺复位ICH_PWROK(主复位)的现象是电流保持0.38A左右不掉电。
再将表格整理如下:
整理表2.jpg
登录/注册后看高清大图


未完,接下页。   

作者: xueflyer    时间: 2013-4-14 19:55
本帖最后由 xueflyer 于 2013-4-14 20:34 编辑

第二部分:维修方法、思路

    故障点分析整理过了,接下来,再来说说具体的维修方法,或者叫维修思路。
也就是如何缩小故障范围,最终判定故障点的办法。
我个人常用的方法,自己取个名字暂且叫做“三步调试法”。
先做了个LL7主板的大致上电时序:
LL7时序1.jpg
登录/注册后看高清大图

LL7时序2.jpg
登录/注册后看高清大图

由时序图来看,“触发后0.30.53A掉电”这一故障现象对应的故障点散布的范围较广。从“EC发出SUSONMAINON直至“CPU得到PLTRST#信号”为止。
在讲“三步调试法”之前,先说说几点维修认识:
1.  在主板的上电时序中,将有些信号切断后,时序中止,电流会保持某个值,不掉电。而切断另外一些信号,则会立即掉电。还有些信号切断后,是掉电再自动重启再掉电,反复循环。
2.  切断EC发给VRM芯片的VRON信号,会导致时序中止。(在LL7主板上的现象是:电流保持在0.35A左右,不掉电。)这样人为切断VRON信号,非常有利于测量VRON之前的按时序该产生的电压和该发出的信号是否都已正常。
3.  切断VRM芯片发给PCH芯片的ICH_PWROK信号,也会导致时序中止。(在LL7主板上的现象是:电流保持在0.38A左右不掉电。)按照时序,在VRON信号和ICH_PWROK信号之间该有+VCORE电压产生。因此,利用这两个信号能够方便地判定+VCORE电压是否已经稳定和正常的。
另外,给PCH芯片的ICH_PWROK信号虽然被切断了,VRM给时钟芯片的开启信号CLKEN#不受影响,时钟芯片会发出所有PCH需要的时钟信号。因为此时主板电流保持不掉电,所以非常便于用示波器测量稳定波形。
4.  还有一个,切断给CPU芯片的H_VTTPWRGD信号,也会导致时序中止。(在LL7主板上的现象是:电流保持在0.51A左右不掉电。)此时,主板上PCH发给CPU的最后几个信号PM_DRAM_PWRGDH_PWRGOODCLK_CPU_BCLK/#PLTRST#都已正常产生。
这个H_VTTPWRGD信号常被忽视,似乎在时序图中也没见到它的身影。所以,它起作用的时间点无法准确的判定。但就实验结果来看,它似乎是在PLTRST#之后才被采用。如果我们还是遵循以前的认识,以PLTRST#为硬启动的结束。那么就不妨认为,在时序中H_VTTPWRGDPLTRST#是同时起作用的。   CPU缺少PLTRST#会立即掉电,而缺少H_VTTPWRGD则会电流保持。这是两者最明显的区别,也是我们要用H_VTTPWRGD做调试点而不用PLTRST#的原因。
5.  最后一个,取下或翘起PCH-BIOS芯片,也会导致时序中止。(在LL7主板上的现象是:电流保持在0.80A左右不掉电。)
特别声明:这只限于HM5X平台及以前芯片组主板。HM6X及以后平台取下PCH-BIOS会引起掉电。
有了以上几点维修认识,接下来看“三步调试法”就好理解了。
“三步调试法”:
第一步:
    切断VRON信号。  如果依旧掉电,则为HWPG故障。查HWPG的组成电压是否有异常。               如果电流保持,到下一步。
第二步:
恢复VRON信号,再切断ICH_PWROK信号。    如果依旧掉电,则为+VCORE电压产生异常。查VRM芯片的供电条件、芯片是否损坏、周围元器件是否异常等。
如果电流保持,测量时钟芯片发给PCH的所有时钟是否正常。   如果不正常,则查时钟芯片的工作条件、晶振、周围元器件是否损坏等。   
如果时钟正常,到下一步。
第三步:
恢复ICH_PWROK信号,再切断H_VTTPWRGD信号。    如果依旧掉电,则查PM_DRAM_PWRGDH_PWRGOODCLK_CPU_BCLK/#PLTRST#这几个信号是否有瞬间的跳变。再断电测量线路的对地二极体值,看是否短路、断线、线路上的电阻阻值是否变大。        如果线路没有问题而信号没有起来,则可能是PCH芯片不良。
            如果信号已经发出,则查是否CPU座空焊。或DMI/FDI总线是否不通,可能是CPU座或PCH芯片空焊。如有CPU带灯测试座则比较方便理想。
    如果不掉电,则考虑独显是否多处电压短路。
    自己认识有限,大概就只能说到这了。
可能很多信号名称在不同主板上会不一样,请大家注意对应。
文中错误的地方请大家帮我指出,分析不当的地方,欢迎大家讨论!谢谢!
     

作者: xueflyer    时间: 2013-4-14 20:03
写的有点长,只好分贴发出。
本来制作的表格,可发出后格式就乱了,只好做成图片来发,所以内容有点模糊,只能这样了。
帖子的排版功能不给力,文字都堆一块,不好看了。

后面我会将做的WORD原件发出来,供大家下载,里面排版就不会这么乱了。
作者: xueflyer    时间: 2013-4-14 20:25
word原件:
HM55平台0.3~0.53A掉电维修经验小结(Ver1).zip (312.86 KB, 下载次数: 1084)