迅维网

查看: 4032|回复: 75
[显卡维修]

关于N卡显卡诊断测试程序使用方法与现在论坛很火的所谓的DIAG脚本我有话要说

    [复制链接]
发表于 2021-4-22 01:58:51 | 显示全部楼层 |阅读模式
本帖最后由 linglongx 于 2021-4-22 03:05 编辑

神神密密的DIAG脚本是个什么鬼,看图:
捕获.JPG

MODULAR DIAGNOSTIC SOFTWARE  翻译过来就是:模块化诊断软件 ; 简称就是MODS  这也是英伟达出品的自家 N卡诊断测试主执行程序文件名.

通常情况下执行测试是要调用脚本文件执行的,而这儿的脚本文件是一系列英伟达事先写好的经过预编译的Java脚本文件
mods gputest.js –mfg

如上命令中的 gputest.js 实则是调用预编译的脚本文件gputest.jse
这些预编译的脚本文件存存于MODS模块所在文件夹.


而所谓的 "DIAG脚本" 其实就是linux系统可执行脚本文件中的一系列 mods 测试命令.
而这些测试命令的都出自mods.pdf文档中.(mods.pdf 一般在MODS诊断测试包中自带,不要问为什么你的mods包中没有mods.pdf文档)
某些别有用心的人故作高深,取 DIAGNOSTIC 前4个字母 DIAG 然后加个"脚本",linux系统可执行脚本摇身一变就变成了高深的 "DIAG脚本".


下面我摘要一些常用命令:

通常,通过使用命令行来调用MODS:
mods gputest.js –mfg(用于CEM测试)
mods gputest.js –oqa(用于OEM传出质量检查测试)
这两个测试选项之间的区别在于–mfg选项可运行完整套件
测试。 –oqa测试是压力较小且更快的优化测试套件速度和覆盖范围。

MODS测试套件通常以部件号(例如 “ 618-60506-3501-CX0。” )的包装形式分发给客户
这些包装已通过测试特定产品的资格
并包含针对该卡定制的发行说明和批处理文件。


由上面的意思可以得知要正常运行MODS 不同的显卡是需要运行对应的版本的MODS模块的.

–mfg 有派生出一个 –mfg2命令 功能与 –mfg 一样.

常规情况下 单纯执行 mods gputest.js –mfg 测试命令是执行所有常规测试项,由于某些情况下,个别测试测会出错, 默认情况下测试出错会立即停止测试,
这时我们可以加入 –run_on_error 命令.(即使测试错误也断续执行测试) 所以命令可以是如下所示:

mods gputest.js –mfg  –run_on_error

完成测试后会退回linux命令行并在MODS模块文件夹中生成mods.log日志文件,我们可以使用  less mods.log 命令查看 mods.log日志的内容.
执行完  less mods.log 后可使用键盘的翻页键来阅读全部日志文本. 按 Q 键可退出 less 并返回 linux 命令行.
日志文件头首先会显示被测显卡的详细信息:

MODS start: Tue Apr 20 14:33:24 2021

Command Line : gputest.js -corr_error_tol 10 -pex_crc_tol 10 -pex_nak_rcvd_tol 10 -pex_nak_sent_tol 10 -pex_l0s_tol 10 -pex_line_error_tol 10 -dev all -mfg -run_on_error -matsinfo

CPU
Foundry   : GenuineIntel
Name      :  Intel(R) Core(TM) i5-3470 CPU @ 3.20GHz
Family    : 6
Model     : 10
Stepping  : 9

Version
MODS           : 331.46
OperatingSystem: Linux (x86_64)
Kernel         : 4.4.1-gentoo
KernelDriver   : 3.66
HostName       : tinylinux
Sys-uuid       : 03000200-0400-0500-0006-000700080009

FbStrap set to 0x0
                 gpu 0  dev.sub 0.0         
                 ---------------------------
PCI Bus Dev Fun: 0x01, 0x00, 0x00            
DID            : 0x1381                     
Raw ECID       : 0x003fe51d0000000035c72441  
ECID           : T3N794-20_x-2_y01           
Device Id      : GM107         ;GPU核心代号
Revision       : a2                          
NV Base        : 0xf6000000                  
FB Base        : 0xe0000000                  
IRQ            : 11             ;显卡使用的系统中断号    
Raw ECID (RM)  : 0                           
Dev0 override reg 0x406020: andMask=0x04000000 val=0x00000000
Subdev 0 reg 0x406020 was 07410001 wrote 03410001
Foundry        : TSMC                        
Subsystem VID  : 0x7377                     
Subsystem DID  : 0x0000                     
Board ID       : 0xe708                     
Chip SKU (BIOS): 300-0                       
Project        : 2010-0051                  
Display        : 0x000001                    
VGA adapter    : Primary                     
Memory Size    : 2048 MB                   ;显存大小
RAM Protocol   : GDDR5                      ;显存版本
RAM Location   : Dedicated Gpu Memory        
RAM Config     : 6                              
ROM Version    : 82.07.25.00.51          ; 显卡ROM版本   
ROM Type       : Partner Production         
ROM OEM Vendor : Colorful                  ;显卡ROM中的品牌
ROM Timestamp  : 2014-2-28 06:37:46  ;显卡ROM版本生成时间
TV Encoder     : NVIDIA_G80                  
PState (mode)  : [0] 8                       
PState Version : 2.0                        
EDC            : Disabled                    
GPC 2x Clock   : 2352.5/2352.5 MHz GPCPLL   
DRAM Clock     : 2505.6/2505.6 MHz MPLL      
Host Clock     : 571.4/571.4 MHz XCLKGEN3   
XBar 2x Clock  : 2160.0/2160.0 MHz XBARPLL   
Sys 2x Clock   : 2116.5/2116.5 MHz SYSPLL   
Power Clock    : 324.0/324.0 MHz SPPLL0      
MSDec Clock    : 405.0/405.0 MHz SYSPLL      
Display Clock  : 648.0/648.0 MHz SPPLL0      
Core Voltage   : 1131 mV                     
GPC  Mask      : 0x01 (1 GPC)               
TPC  Mask      : [17] (4 TPCs)               
FB   Mask      : 0x03 (2 FB Partitions)      
FBIO Mask      : 0x03 (2 FBIO Partitions)   
FBIO Shift Mask: 0x00                        
XP   Mask      : 0x03 (2 3gio Pads)         
Gpu Temp       : 35 deg C                    
PEX Width, ASLM: 16 lanes, Not Supported     
PEX Link Speed : 8.0 Gbit/s                  
PEX BandWidth  : 128.0 Gbit/s               
ASPM, ASPM-CYA : (L0s/L1, Disabled)         
ASPM L1SS, CYA : (Disabled, L1.1/L1.2)      

Chipset
VID            : 8086 (Intel)
DID            : 1C10 (IntelP67)
Chipset ASPM   : L0s/L1

RM Version     : rel/gpu_drv/r331/r331_00-5467
gputest.js     : 59
mfg.spc        : 7
boards.js      : 7

Dev,sub 0,0 reg 0x406020 now 03410001
Running test(s) on GeForce GTX 750 (gpu 0, DID: 0x1381, PCI Bus Dev Fun: 0x01, 0x00, 0x00)  

;备注: 在PCI总线 1 第0个设备,功能号0 的硬件ID为 0x1381(也即GTX 750 ) 的设备上运行测试

;=================开始测试============================

Enter JsGpuTest.SetPState (test 0)    ;执行第0个测试项 JsGpuTest.SetPState
Switched to PState 0 (0.max). Pcie Speed=8000, x16
ClkM      =  2505.60 MHz
ClkHost   =   571.43 MHz
ClkDisp   =   648.00 MHz
ClkPA     =    38.25 MHz
ClkPB     =    27.00 MHz
ClkGpc2   =  2352.48 MHz
ClkXbar2  =  2160.00 MHz
ClkSys2   =  2116.45 MHz
ClkHub2   =  1080.00 MHz
ClkUtilS  =   108.00 MHz
ClkPwr    =   324.00 MHz
ClkMSD    =   405.00 MHz
nvvdd = 1131 mV                ;核心电压
Exit 000000000000 : JsGpuTest.SetPState (test 0) ok    ;退出代码为 000000000000  第0项测试通过
Enter JsGpuTest.CheckConfig (test 1)
Exit 000000000000 : JsGpuTest.CheckConfig (test 1) ok

Enter I2CTest.Run (test 50)     ;执行第50个测试项
Exit 000000000000 : I2CTest.Run (test 50) ok  ;第50个测试项通过

Enter ValidSkuCheck.Run (test 17)
IFF fuse detected @ row 62
Found SKU:  GM107-300-A2     ;GPU核心代号与版本



!!!!!!!!!!!!!!!!!!!!!!!!!!!!! BOARD SUMMARY !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!! Found P2010 SKU51 2GB (0)
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

Exit 000000000000 : ValidSkuCheck.Run (test 17) ok
Enter JsGpuTest.CheckThermalSanity (test 31)
Exit 000000000000 : JsGpuTest.CheckThermalSanity (test 31) ok
Enter JsGpuTest.CheckFanSanity (test 78)
Exit 000000000000 : JsGpuTest.CheckFanSanity (test 78) ok

Enter JsGpuTest.CheckHDCP (test 24)   ;执行 HDCP检查
No HDCP-capable devices found!         ;显卡不支持HDCP

;注意下面的行起头是 Error ; 说明测试出错

Error 006400024239 : Global.CheckHDCPInternal invalid display type
Error 006400024239 : Global.RunDisplayJsGpuTest invalid display type
Exit 006400024239 : JsGpuTest.CheckHDCP (test 24) invalid display type
Error!
Error 006400024239 : JsGpuTest.Run (test 24) invalid display type    ;第24项测试出错


Enter GpuPllLockTest.Run (test 170)
Exit 000000000000 : GpuPllLockTest.Run (test 170) ok
Enter FastMatsTest.Run (test 19)
Exit 000000000000 : FastMatsTest.Run (test 19) ok
Enter NewWfMatsTest.WfMatsMedium (test 118)
Bps: 53.5771 GB read or written per second (165.5612 GB in 3.090 sec)
Bps: 66.8% percent of raw FB bw (80.1792 GB per second)
Exit 000000000000 : NewWfMatsTest.WfMatsMedium (test 118) ok
Enter NewWfMatsTest.RunLiveFbioTuning (test 180)
Bps: 2.2846 GB read or written per second (1.0737 GB in 0.470 sec)
Bps: 2.8% percent of raw FB bw (80.1792 GB per second)
WaitForBlitLoopDone subdev 0 did 0.001748MB pcie traffic
Exit 000000000000 : NewWfMatsTest.RunLiveFbioTuning (test 180) ok



好几百个测试项就不在这儿一 一列举了.后面我会提供GTX 1080测试模块中的MODS.PDF文件,有兴趣的朋友可以自己查看,不懂英文的自行GOOGLE翻译.


下面我们看一下日志文件尾:

Enter KFuseSanity.Run (test 106)
Exit 000000000000 : KFuseSanity.Run (test 106) ok
GPU tests completed.
Error 000108000239 : Object.RunGpuTests invalid display type
Dev,sub 0,0 reg 0x406020 now 03410001

Failure(s) :
LOOP           TEST                 CODE               MESSAGE
----  ------------------------  ------------  ---------------------------
   1   CheckHDCP                 006400024239  invalid display type

Error Code = 006400024239 (invalid display type)


#######     ####    ########  ###      
#######    ######   ########  ###      
##        ##    ##     ##     ###      
##        ##    ##     ##     ###      
#######   ########     ##     ###      
#######   ########     ##     ###      
##        ##    ##     ##     ###      
##        ##    ##  ########  ########
##        ##    ##  ########  ########



由 # 字符构成的图片式字母代表所有测试项是否通过;一般来说 FAIL 代表不通过, PASS代表通过 但显示 FAIL并不一定代表显卡就有问题.
具体需要找到所有出错的测试项来判定.比如前面的第24项测试 HDCP检查 没有通过但并不代表显卡有问题:

HDCP 解释

某些图形卡支持称为HDCP(高清内容保护)的加密协议。
此协议在支持HDCP的数字平板和支持HDCP的图形卡之间加密数据。
测试HDCP的唯一方法是在连接了支持HDCP的显示器的情况下启用它。
MODS的目标之一是默认情况下强制执行教科书正确的测试。
因此,将在启用HDCP的卡上自动运行HDCP测试。
这样做的结果是,在测试支持HDCP的卡时,必须连接支持HDCP的显示器,否则MODS将会失败。
如果用户不希望出现这种情况,则可以使用“ -skip 24”命令行参数明确跳过HDCP测试。



这儿出现了一个新命令 -skip ; -skip 24 意为跳过第24项测试,如是我们的测试命令可以是如下所示:

mods gputest.js –mfg  –run_on_error –skip 24


类似的测试项选择参数还有


-add X           ;除了执行所有常规测试项还单独进行第X项测试,如果显卡不支持该测试项则自动跳过
-force X         ;除了执行所有常规测试项还单独进行第X项测试,如果显卡不支持该测试项也强制执行
-skip X          ;执行除X项测试以外的其它所有常规测试项
-test X           ;单独执行X项测试
-testforce X    ;强制执行X项测试


以上参数都可重复使用比如:


mods gputest.js –mfg  –run_on_error –skip 24 –skip 118     ;运行除第24, 118测试项外的所有测试,即使某项测试出错也继续执行后面的测试
mods gputest.js –mfg  -test 92           ;只执行测试项92

测试项代号,测试项名称与功能在MODS.PDF文档中以表格的形式说明;[siz ... ...        
本帖为精华帖,如要查看隐藏内容,请支付0.5元给本帖作者。写帖不易,请多支持。立即支付

评分

参与人数 38下载分 +123 金币 +116 收起 理由
2364949942 + 2 + 2 给愿意分享经验的人加分!
唐茂标 + 5 + 5 精品文章
kkkake + 1 + 2 精品文章
心心心心 + 2 + 2 精品文章
新芯箱硬88 + 5 + 5
魏崇君 + 2 + 2 精品文章
低凋、进行曲 + 5 + 5 精品文章
zhangxuhvi + 5 + 5
hhh111 + 2 老司机!双击666+关注.....
划破夜空 + 5 精品文章

查看全部评分

本文由 linglongx 原创或被授权转载制作,其他机构或个人未经许可严禁转载。
发表于 2021-4-22 10:29:05 | 显示全部楼层
有些人以卖软件为生,他们将于5分钟到达战场……

回复 支持 5 反对 0

使用道具 举报

发表于 2021-4-22 14:03:22 | 显示全部楼层

楼主一发,某位在加拿大的朋友要哭了

回复 支持 2 反对 1

使用道具 举报

发表于 2021-4-22 11:46:33 来自迅维网APP | 显示全部楼层
楼主一发,某位在加拿大的朋友要哭了

回复 支持 3 反对 0

使用道具 举报

发表于 2021-4-23 16:14:06 来自迅维网APP | 显示全部楼层
很多时候,是没有加载对应核心的缺陷文件导致,比如屏蔽a的1060,屏蔽a1的1080ti

回复 支持 1 反对 0

使用道具 举报

发表于 2021-4-22 14:06:16 | 显示全部楼层
表示看得头皮发麻

回复 支持 1 反对 0

使用道具 举报

发表于 2021-4-22 14:03:04 | 显示全部楼层
维修空间6 发表于 2021-4-22 09:14
就是一套工具而已,你把它复杂化了,像我这套工具是把所有的命令都做成了一个选单,而无需敲复杂繁琐的命令 ...

只说不练,假把式。把你的共享出来。

点评

这么好的东西哪能共享  详情 回复 发表于 2021-4-22 15:23
回复 支持 1 反对 0

使用道具 举报

发表于 2021-4-22 13:40:08 | 显示全部楼层
本帖最后由 甄小丁 于 2021-4-22 13:48 编辑

这一下可完了,估计又会出现很多二修卡了,小白看了也会蠢蠢欲动,老鸟先下手为强,从此江湖上又多了很多显卡冤魂

回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2021-4-22 02:19:37 | 显示全部楼层
本帖最后由 linglongx 于 2021-4-22 02:21 编辑

自已占个沙发,贴上网上来的显存布局图
捕获2.JPG
捕获3.JPG
捕获4.JPG

点评

有些正背面都有显存的,怎么判断呢  详情 回复 发表于 2021-4-22 14:04

评分

参与人数 2下载分 +7 金币 +7 收起 理由
遇说还修 + 5 + 5 精品文章
486258 + 2 + 2 不加分不可能的

查看全部评分

回复 支持 1 反对 0

使用道具 举报

发表于 2021-4-22 02:55:22 来自迅维网APP | 显示全部楼层
会不会加精看不了了

点评

学习到知识还不舍得这0.5吗  详情 回复 发表于 5 天前
所以机智的我先把当前网页保存为图片,慢慢消化。。。  详情 回复 发表于 2021-4-22 10:03
回复 支持 反对

使用道具 举报

发表于 2021-4-22 08:04:13 | 显示全部楼层
软件那里下载呢

回复 支持 反对

使用道具 举报

发表于 2021-4-22 08:04:44 | 显示全部楼层
软件从那里下载

回复 支持 反对

使用道具 举报

发表于 2021-4-22 08:29:15 | 显示全部楼层
学习了!大佬讲解的很详细

回复 支持 反对

使用道具 举报

发表于 2021-4-22 09:14:02 | 显示全部楼层
就是一套工具而已,你把它复杂化了,像我这套工具是把所有的命令都做成了一个选单,而无需敲复杂繁琐的命令,所谓DIAG就是测试GPU而已,办不过进行了超频测试

点评

你又不发出来,有什么用  详情 回复 发表于 2021-4-22 14:53
只说不练,假把式。把你的共享出来。  详情 回复 发表于 2021-4-22 14:03
回复 支持 反对

使用道具 举报

发表于 2021-4-22 09:24:57 来自迅维网APP | 显示全部楼层
强烈要求加精。。。

回复 支持 反对

使用道具 举报

发表于 2021-4-22 09:53:36 | 显示全部楼层
支持一下!

回复 支持 反对

使用道具 举报

发表于 2021-4-22 09:56:02 来自迅维网APP | 显示全部楼层
加精加精!

回复 支持 反对

使用道具 举报

发表于 2021-4-22 10:03:28 | 显示全部楼层
一问三不知 发表于 2021-4-22 02:55
会不会加精看不了了

所以机智的我先把当前网页保存为图片,慢慢消化。。。

回复 支持 反对

使用道具 举报

发表于 2021-4-22 10:20:19 | 显示全部楼层
尽管没太看懂,还是赶紧存起来,估计不久就会加精!

回复 支持 反对

使用道具 举报

发表于 2021-4-22 10:22:10 | 显示全部楼层
英文不好,看不懂手册。

回复 支持 反对

使用道具 举报

发表于 2021-4-22 11:25:25 | 显示全部楼层
满满的干货。楼主比精了。

回复 支持 反对

使用道具 举报

发表于 2021-4-22 11:38:08 | 显示全部楼层
这帖子真的很良心 很精彩

回复 支持 反对

使用道具 举报

发表于 2021-4-22 12:19:48 | 显示全部楼层
机智如我!

回复 支持 反对

使用道具 举报

发表于 2021-4-22 13:18:18 | 显示全部楼层
一脸懵逼的进来、一脸懵逼的出去!

回复 支持 反对

使用道具 举报

发表于 2021-4-22 13:23:50 | 显示全部楼层
虽然我看不懂也用不上,楼主每次发的都是干货

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表
附近
店铺
维修
报价
信号元
件查询
点位图


全文搜索

快速回复