迅维网

标题: (求助中)DELL R730XD主板不定时掉电疑难求助 [打印本页]

作者: lee11010    时间: 2024-6-12 11:24
标题: (求助中)DELL R730XD主板不定时掉电疑难求助
本帖最后由 lee11010 于 2024-6-12 11:42 编辑

微信图片_20240612111346.jpg
登录/注册后看高清大图

服务器DELL R730XD,板号38Y6R  版本号:A02(2),
正常使用过程中突发掉电,掉电以后不能正常再开机,需要拨除电源几分钟时间再上电,可以正常触发开机,但是仍不定时掉电,在BIOS、WINDOWS系统都会掉电,时间不定时,掉电的时候,主板只亮IDRAC区域的一颗绿灯,测量无待机电压。已更换电源,更换内存,更换CPU,最小化系统,都一样,仍会掉电。在正常运行期间,升级BIOS和IDRAC固件都正常进行,升级后仍存在掉电的情况,最长一次AIDA64拷机了两个多小时才掉电。
经过多次的反复上电,现在出现告警,DIMM电压超出范围的告警,一上电就告此警告,,IDRAC运行,但不能开机;
如果放电以后仍存在告警,通过拔除CMOS电池,再放电一会,再上电,就可以开机,开机后仍存在掉电或DIMM电压告警;

没有维修经验,无从下手,也问了很多地方了,没有这款机器的图纸,故寻求大神指点,感激涕零。


掉电以后,只亮一灯,此时无待机电压,此时IDRAC也没有工作,测量无电压;
微信图片_20240612111342.jpg
登录/注册后看高清大图



放电以后,能开机,指示灯排亮起,进入系统可拷机,不定时掉电;
微信图片_20240612111343.jpg
登录/注册后看高清大图



有时一上电,开机指示灯排前后两个灯闪,IDRAC有告警信息,DIMM电压超出范围,不能开机;



微信图片_20240612111347.jpg
登录/注册后看高清大图


网上找了一张主板大图,供参考
DELL R730主板.jpg
登录/注册后看高清大图









作者: JasonW    时间: 2024-6-12 11:35
没点位 电路图难,先查内存供电电路,再升级下BIOS试试
作者: lee11010    时间: 2024-6-12 11:37
JasonW 发表于 2024-6-12 11:35
没点位 电路图难,先查内存供电电路,再升级下BIOS试试

BIOS和IDRAC固件已升级最新,未能解决故障,不知道如何查内存供电,只会测试待机电感的待机电压,而且去除CMOS电池后放电,再上电,可开机,可进系统测试,不定时掉电,掉电后,无待机电压,类似有保护。
作者: JasonW    时间: 2024-6-12 11:39
lee11010 发表于 2024-6-12 11:37
BIOS和IDRAC固件已升级最新,未能解决故障,不知道如何查内存供电,只会测试待机电感的待机电压,而且去 ...

多数是内存供电过截(微短), 用热成像扫下应该能发现
作者: lee11010    时间: 2024-6-12 11:40
JasonW 发表于 2024-6-12 11:35
没点位 电路图难,先查内存供电电路,再升级下BIOS试试

应该是待机电路的问题,引起的DIMM电压告警和掉电保护,DIMM电压告警是后面才出现的,之前掉电后直接保护了,不能开机,需要放电以后才可以上电开机,去CMOS电池会直接开机,不用手动触发。
作者: lee11010    时间: 2024-6-12 11:43
JasonW 发表于 2024-6-12 11:39
多数是内存供电过截(微短), 用热成像扫下应该能发现

太专业了,没有热成像
作者: gingerluo    时间: 2024-6-12 21:07
没有图纸想查掉电太难了
作者: gingerluo    时间: 2024-6-12 21:08
不过建议一个思路,不能触发说明是桥保护了,极有可能是thermtrip
作者: lee11010    时间: 2024-6-13 08:12
gingerluo 发表于 2024-6-12 21:08
不过建议一个思路,不能触发说明是桥保护了,极有可能是thermtrip

现在测试,保护后,TPS53513电源管理芯片的EN脚没有电平,但是前级触发是谁给出的,找不着;
作者: lee11010    时间: 2024-6-13 08:20
本帖最后由 lee11010 于 2024-6-13 08:23 编辑

1718237960222.png
登录/注册后看高清大图

作者: lee11010    时间: 2024-6-13 08:22
1718238106239.png
登录/注册后看高清大图

作者: zhao5900    时间: 2024-6-13 12:03
那个元器件温度高 掉电的吧 或者时钟没有
作者: gingerluo    时间: 2024-6-13 12:38
lee11010 发表于 2024-06-13 08:20
本帖最后由 lee11010 于 2024-6-13 08:23 编辑

这应该是桥给的,桥本来就有erp之类的功能可以关闭一部分s5供电的
作者: lee11010    时间: 2024-6-13 13:44
zhao5900 发表于 2024-06-13 12:03
那个元器件温度高 掉电的吧 或者时钟没有

无头绪,放电一下,能开机。不定时掉电。
作者: lee11010    时间: 2024-6-13 13:45
gingerluo 发表于 2024-06-13 12:38
这应该是桥给的,桥本来就有erp之类的功能可以关闭一部分s5供电的

DELL的bmc是上电就工作的,应该不会主动关断。应该是保护了。
作者: lee11010    时间: 2024-6-15 08:52
把这个电阻去除,从原来的2个多小时掉电,延长到5个小时掉电。没搞明白...

                               
登录/注册后看高清大图


                               
登录/注册后看高清大图

作者: 曹凯电脑    时间: 2024-6-16 08:48
元器件不良吧
作者: 洞口谢师傅    时间: 2024-6-16 11:15
本帖最后由 洞口谢师傅 于 2024-6-16 11:17 编辑

我有图纸点位,不过这图纸太复杂,我都不怎么看得懂。
微信截图_20240616110646.png
登录/注册后看高清大图

微信截图_20240616110758.png
登录/注册后看高清大图

TPS53513电源管理芯片有3V和5V两个,楼主去掉的电阻看原理图打叉应该是可以不装的吧
微信截图_20240616110858.png
登录/注册后看高清大图

微信截图_20240616110952.png
登录/注册后看高清大图

微信截图_20240616111041.png
登录/注册后看高清大图

thermtrip也可以搜,不截图了。

作者: lee11010    时间: 2024-6-17 06:37
洞口谢师傅 发表于 2024-06-16 11:15
本帖最后由 洞口谢师傅 于 2024-6-16 11:17 编辑

我有图纸点位,不过这图纸太复杂,我都不怎么看得懂。


TPS53513电源管理芯片有3V和5V两个,楼主去掉的电阻看原理图打叉应该是可以不装的吧



thermtrip也可以搜,不截图了。

太牛了,能分享一下图纸吗,我测一下条件。

                               
登录/注册后看高清大图

                               
登录/注册后看高清大图

                               
登录/注册后看高清大图

作者: 来学艺    时间: 2024-10-28 16:00
lee11010 发表于 2024-6-17 06:37
太牛了,能分享一下图纸吗,我测一下条件。

我也想要。
作者: u1571682    时间: 2024-11-14 17:58
第二个症状一模一样,今天刚换了下5号风扇座边上的LM393比较器,我理解是DIMM的3.3V和3.3V参考的一半比较,产生所谓的DIMM PG信号,但是换了也没啥效果。

IMG_2058.jpeg
登录/注册后看高清大图


比较器右侧从上往下数第二个电阻两端是3.3V和0.096V,原先我以为是比较器坏了导致流进去电流比较大,但是换了也没用,后来量了一下3.3V轨道对地阻抗102Ω,应该确实有哪里短路,但是没热成像也比较难搞,唉

如果拿镊子短接这个电阻,左边电压会马上升上去,然后拿掉就很快下降,像电容存不住电一样,但是不会马上降到之前的0.096V,这段时间内如果按开机键是可以开机的,如果开不了机可以临时试试
作者: u1571682    时间: 2024-11-14 18:01
本帖最后由 u1571682 于 2024-11-14 18:04 编辑
洞口谢师傅 发表于 2024-6-16 11:15
我有图纸点位,不过这图纸太复杂,我都不怎么看得懂。



另外,大佬,同求一份点位网上找遍了都没找到
作者: u1571682    时间: 2024-11-25 12:27
我的也变成这样了,本身是报DIMM电压异常不触发,DIMM电压比较器那里做一下手脚可以开机,后面发现待机通电久了整个控制面板会掉电,idrac也断电,网上说拔掉控制面板可以解决,拔掉后待机不会掉电,但运行约10分钟整机突然停机,后变为和lz完全一样的情况。同时:主板7个诊断LED灯号为“闪-灭-灭-亮-灭-灭-闪”,查了下手册说是辅助供电保护(AUX. power failsafe)




欢迎光临 迅维网 (https://www.chinafix.com/) Powered by Discuz! X3.4