马上注册,获取阅读精华内容及下载权限
您需要 登录 才可以下载或查看,没有帐号?注册
x
近日收到一个老客户寄修的Dell 外星人经典游戏大本本,官方称呼是Alienware 18,民间俗称M18 R3。2014年左右出品的奢侈品,台台都是好几万的玩意,屏幕18.4寸,配置四代可拆卸移动CPU,2条MXM独立显卡插槽,4条内存插槽,RGB灯光当然不会缺少。
虽然此机发布8年有余,但是如果配上i7 4940mx,980m sli或者探索版的bios上GTX1070,插满32G内存,塞几个1T SSD,性能还是很好的,3风扇配合硕大的体积,散热不成问题,绝不是现在那些轻薄机30秒降频跌成狗能比的。但是就是这么一台顶配的真男人,经不起岁月的摧残,换上了ED症,几秒就完蛋,且看我老中医如何望闻问切,妙手回春。
故障描述: 1、可以正常点亮,可以进PE安装系统,安装完以后第一次重启OK,再重启就会随机报错无法进入系统,多次重装无果。 2、 找一个已经安装好系统的硬盘开机,也会随机报错或者重启,多次尝试以后可以稳定进系统,但是反应很迟钝,查看CPU频率锁定在0.78GHZ。 机器到手后开机测试,顺利进入桌面,查看cpu频率,妥妥的3.7GHZ啊,反应很快,一点都不迟钝,难道是快递帮忙修好了?正在奇怪的时候,屏幕突然黑了,机器重启了。再次亮机以后进入系统的过程中又重启了。让它自己反复重启了几次以后某次可以正常进系统了,不会再死机或者重启,此时感觉整机反应速度卡顿,查看cpu频率果然锁死在0.78GHZ不变了。
对于这个故障,第一反应怕不是硬盘系统配置问题吧?那直接进PE 看看。PE 下还是锁在0.78GHZ 。那好,先来个bios 放电大法。几分钟以后结果是故障依旧。只好拆机了,这个机型修过很多台了,轻车熟路拆开C 壳总成,卸掉上半身总成,露出雄壮的真男人面目,好大一张主板!
原机的U 是个i7 4910mq ,随手换了个15 块钱的2950m 进去。正常点亮跑起来以后居然也是重复上述2 的表现,只是会比i7 4910mq 出现锁最低频率的时间长不少,可能能坚挺5 分钟左右才会掉到0.78GHZ 。看来此机的一个明显故障特点就是冷机开机cpu 不会降频但是会死机重启,热了以后不死机但是会锁最低频率。事到如今,既然跟系统和cpu 都无关,只能再赌一把bios ,不行再查电路。刷了个bios 以后还是不行!还好有图纸和点位坐镇,心里一点都不慌。因为冷机开机的故障是死机和重启,查起来比较麻烦,所以打算等它热了以后能稳定运行再说。一般cpu 降频或者锁频都是触发了H_PROCHOT# 信号所致,原因可能有1、 EC 检测不到有效的电源适配器功率信号2、 CPU 核心供电模块检测到过高的温度3、 检测到过高的电池温度4、 风扇不转等等对于上面提到的4 点,1,3,4 都是可以马上排除的,因为bios 里面可以识别到电源功率,电池不装也会降频,风扇是正常运转的。所以我们重点来排查2 ,CPU 核心供电模块的问题。
以上就是CPU 过热信号检测的几个部分电路,有EC 通过QE22 实施控制、VR 控制器ISL95816 的4Pin ,还有电池温度信号通过PQ8 来实现。实测结果是当冷机开机cpu 不会锁低频的时候,QE22 的D 级H_PROCHOT# 信号是高电平1V ,亮机一会以后H_PROCHOT# 就变成0V 了。
而此时QE22的G级即EC发出来的控制信号是低电平,这表明EC并没有发出来这个过热信号,而PQ8电池温度检测信号在主板上是没有上件的,所以发出来过热报警信号的只能是VR控制器ISL95816了。VR_HOT信号通过RE80并入H_PROCHOT#,那么把它拿掉是不是就可以取消这个预警信号了呢?RE80在pcb上是一段导线,没有实物,实测把它割掉以后,H_PROCHOT#的确就恢复到了高电平,预警信号的确是来自ISL95816。那么是不是这样就可以解决问题了?没这么简单啊,断开这个预警信号以后,系统都没进完机器就已经黑屏然后重启了。所以看起来这个VR控制器发出来的预警信号是真的有用的:主板的确有地方过热了。到这个时候才想起来看看主板整机电流,果然看到了明显异常的地方,如下图所示。 这个问题主板在不带任何独立显卡和外设,屏幕,风扇,只装了个2950m亮机u的情况下,整机电流居然有2.38A,这明显是太高了。请出热成像设备照妖镜,找下谁在闹事。
可以很清楚的看到主板cpu VR控制器模块的温度分布图,正面功率电感部分70多度,背面MOS部分已经达到了100多度。把cpu从主板上卸下,上电,重新用热成像设备观察,结果如下
不带CPU空载开机,MOS温度也有80多度,相信随着时间推移,破百也很轻松。同时观察下空载下整机电流有差不多800mA,难怪这么热。
请出 示波器大神,测量功率电感前后级,结果如下首先是不带cpu空载的波形
波形解读:功率电感前级波形不正常。首先频率比较低只有300多KHZ,其次是高电平脉冲数量异常,正常的波形是连续的高电平中间不会断掉,这个现象要么是过流保护要么是控制器异常。电感后端是cpu核心电压,看起来问题不是很大,四代cpu预置电压1.8V正常。然后我们再来看看带一个CPU的情况吧
波形解读:功率电感后端现在已经出现了明显的纹波。前端信号和不带CPU负荷情况下比频率似乎高一点,还是这种断续高电平脉冲状态。 看到这里,大致心里已经搞清楚这台机器的故障根源:因为某些原因这个机器主板的cpu核心供电模块未能正常工作,虽然还能输出电压,但是功率电感和mos发热厉害,冷机时改区域温度缓慢上升,尚未触发VR控制器输出VR_HOT信号,cpu可以全速运作,但是因为供电质量不行,系统容易出现黑屏重启现象。此时主板温度继续飙升,很快达到触发VR_HOT预警信号产生的程度。CPU收到H_PROCHOT#低电平信号后锁死在最低工作频率上。此时系统反而能在0.78GHZ的频率下安全运行起来。而安装不同档次的cpu,因为耗电不同,真男人的表现水平也不一样,越猛男的cpu,萎的越快^_^。既然已经理清问题原因,开始抓妖吧。1、 简单起见,先换一个ISL95816吧。更换结果:故障依旧。2、 观察ISL95816周边RC元件,均为原厂焊接,没有动过,暂时不管3、 拆下PC905~PC908四个330uF钽电容,测量他们的电容值,有重大发现:这几个电容居然量到只有100多uf容量了,他们可是钽电容哦,木有电解液的。
马上换上4个470uF钽电容,故障迎刃而解,妖怪抓住了!以下是故障解决后功率电感的前后级测量波形、热成像设备拍摄的温度图、整机电源功耗数据
可见功率电感上的波形都是连续的了,频率也上升到600多KHZ。CPU核心供电的纹波也很小。
不带cpu整机功耗,低了400mA
带CPU整机功耗,低了有1A,也就是有20W能量之前用来发热,现在去掉了自然不会太热。最后一张是复原整机以后运行实拍图
总结:本案例根源问题还是喜闻乐见的容姑娘犯病引起猛男ED,有维修经验的老鸟可能瞬间秒杀此故障,但不熟悉的人可能会走很多弯路甚至造成故障扩大化,规范化的维修流程和善用高效率的维修工具有组于正确的解决问题。
|