近日,在咸鱼市场¥1XX捡到一块七彩虹igame GTX770 2G坏显卡,已经修好了,现将七彩虹GTX770黑屏维修过程记录下来并顺便谈下NV中高端显卡的供电控制架构。
外观图:
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图1
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图2
故障描述:不插入外接8+8 PCIE电源插头时可以亮机,提示如下图:中文含义是“请关闭电源并为这张图形卡连接上PCIE电源电缆”。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图3
但是插了2个8pin PCIE外接电源插头以后这张卡反而没有任何显示了,手摸核心和电源等部分是冰凉的跟没通电一样。只插一个8pin PCIE电源和一个都不插一样可以亮机,提示和上图一样,全插就没动静了。
处理过程描述:
拆卡,首先观察有没有明显掉件和烧毁的痕迹,结果并未找到这些现象。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图4
此卡做工还可以,6相核心供电+2相显存供电,核心供电主控是NCP4206,显存电源主控是UP1605Q,电源监控IC是INA3221。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图5
因为不插外接PCIE电源插头可以亮机,所以可以推断这张卡的电源部分、核心和显存基本功能基本是正常的,要从电源管理方面找问题。首先晒一个我常用的显卡检修工具,如下图所示,改造于以前上班公司开发的一个小型多路可调电源板。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图6
这个板子的输入是12V电源,一般是接到常规维修电源上的,可以方便改变电压和监控工作电流变化。这个板子的输出是12V,3.3V,其中12V有三路,2路是外接6+2的PCIE插头,另外一路单独输出,接显卡PCIE金手指的那一路是12V,3.3V就是图中红线处。在这个电源板上3.3V是可以通过电位器进行调节大小的,最大输出电流3A。
用这个电源板来修显卡有什么好处呢?第一:用这个电源一般不会因为显卡电源管理出问题再造成严重的二次故障,因为外接的维修电源一般都有过流保护,总功率也不会太高,不像PC ATX电源动不动就把PCB烧起来。第二:用这个电源可以很方便的把显卡PCB拆开放到工作台上慢慢检修,测量和换件测试都很方便。下一步我还会做一个方便维修用的PCE插槽+供电的PCB,不用焊线就可以操作。
现在我们来看看这个卡到底出了什么问题吧!可能有人会问,没有插PCIE外置电源插头的时候,这个卡为什么会有显示呢?我平时碰到的卡不插外部电源一般会报警不会亮的啊?我来解释下,这个其实是NV中高端显卡很习惯使用的设计,就是在没有插入外部PCIE电源插头的时候,显卡仍然可以启动并且在屏幕上显示出来那句英文提示,用户要插入外部电源插头。
只有用户正确的把所有的外部PCIE电源插头都插好了,显卡才能正常使用。而A卡不是这样的设计,A卡如果没有插入PCIE插头显卡的核心供电不会启动,用户开机只能听到主板显卡自检不过的报警声,那N卡在电源设计具体是怎样实现的呢?看下图。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图7
一般来说金手指(PEX_12V_Finger)上去的12V会经过2个隔离作用的MOS到达NVVDD核心、显存供电的其中一相供电的MOS上管部分,即使没有外接PCIE插头插入,核心供电控制器仍然正常打开,核心、显存部分供电相正常开始供电。只不过此时外部电源插入检测部分(通常是一堆
三极管或者与非
门电路组成)会产生一个信号告诉GPU现在不是在正常供电状态下,所以GPU会在屏幕上显示一句英文提示信息并不能正常进系统。
只有外部PCIE电源插头全部插对了,显卡才能处于正常工作状态。这就是说NV中高端显卡核心供电控制器的使能管脚(EN)是默认开启的,只有异常情况下才会被第三方控制信号关断,这个第三方控制信号就来自于INA3221。
INA3221是一款三通道、高侧电流和总线电压监视器,具有一个兼容I2C和SMBUS的接口。INA3221不仅能够监视分流压降和总线电源电压,还针对这些信号提供有可编程的转换时间和平均值计算模式。INA3221提供关键报警和警告报警,用于检测每条通道上可编程的多种超范围情况。
INA3221感测总线(电压在0V至+26V范围内变化)上的电流。此器件由2.7V至5.5V单电源供电,电源电流消耗为350μA(典型值),INA3221的额定运行温度范围为-40℃至 +125℃,兼容I2C和SMBUS的接口具有四个可编程地址。
特性:
可感测的总线电压范围为0V至26V
报告并联和总线电压
高精度:
偏移电压:±80μV(最大值)
增益误差:0.25%(最大值)
可配置取平均选项
四个可编程地址
可编程报警和警告输出
电源运行范围:2.7V至5.5V
应用:计算机、电源管理、电信设备、电池充电器、电源、测试设备。
设计有类似INA3221电路的NV显卡,GPUZ中都可以读到Power Consumption的参数,它汇总了3路12V的电流功率信号以后的显卡TDP估算值。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图8
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图9
如上图所示,NV的设计师用了这颗芯片来监控和测量流入显卡的12V(三路)的电压和电流大小,GPU通过IIC总线来读取数值并根据数据来判断GPU的TDP是否在正常范围内,VBIOS还会根据测量值来调整显卡的工况是否可以持续Boost,是否达到设计功耗墙等等,总而言之这个芯片对显卡是否可以健康工作是至关重要的。它也有几个相关引脚是输出系统电源健康状态的,如Power Valid(PV)是电源可用指示,高电平有效。在本案中,PV参与了控制核心电源控制器的EN,下图红圈处即是3路12V电源输入的电流取样电阻。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图10
好了,到了揭晓答案的时候了,故障原因其实很简单,见下图。
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图11
七彩虹GTX770黑屏维修兼谈N卡供电控制架构 图12
有一个体积比较大的贴片电容被磕歪了一部分,把脆弱的细走线从根部折断了,这个现象肉眼不容易观察到,但是有原理分析在手还是很容易找出问题来的。上图就已经是修复以后的状态了,原始状态没有记录下来。这一路是金手指的12V,VIN输入被意外断开了,芯片检测不到这一路12V存在,理所当然会禁止核心供电的EN产生。但是有人会问了,为什么在没有插入PCIE外接插头的时候也会亮机呢?精华部分来了。
1、在没有插入PCIE外接供电插头的时候负责给PV提供上拉电源的INA3221的16pin VPU是低电平,芯片处于非正常状态,PV pin是悬浮状态,不参与电路控制,核心供电主控NCP4206的EN默认高电平开启,显卡可以持续点亮。
2、在正确插入所有的PCIE电源插头后,INA3221的16pin是高电平,芯片正常工作,所以在这种情况下因为缺失的电压存在,触发了INA3221的PV变低,核心供电主控NCP4206的EN也变低,显卡失去核心和显存供电而出现黑屏。
延伸阅读:
INA3221相关电路出问题还会引起显卡无法满负荷运作、大负荷运转时自动重启、死机、黑屏等各种故障。碰到类似故障可以关注取样电阻,取样电压,通讯总线等相关部分。