【故障案例】CPU低温重启问题的定位和解决

【摘要】某产品研发阶段在做四角实验的过程中,发现单板在低温下出现反复重启动的问题,经过反复的实验和定位,发现是该电源dc-dc芯片使用的液态电解电容,在低温下,内部液体固化。导致电容esr降低,进而使dc-dc输出的纹波变大,出现单板反复重启动的问题。
一、问题的提出
该产品是一款有线通信设备,cpu为1.0v核电压。在该单板做四角实验过程中,温循实验发现单板有重启问题,现象是:低温实验,会存在重启现象了,多次试验重启故障必现。从这个现象看,单板应该是存在设计缺陷,对低温特别敏感。
二、分析过程
根据单板复位的现象,按照时钟、电源顺序排查故障发生时cpu关键信号情况:
1、时钟信号
该单板主时钟为25mhz,通过外部晶体提供。将时钟信号飞线引出,同时放在温箱中。在低温下,发现该单板复位的时候,时钟信号并未出现异常。这里初步排除了不是晶体的问题。
2、电源
其次,考虑是单板上的电源有瞬间跌落的问题,从而导致单板复位。通过用示波器在温箱内监测。主要监测了单板上的3.3v、1.8v、1.5v(ddr3电源)和 1.0v (cpu核电源)。在单板复位信号出现的时候,并没有发现上述电源有过跌落。进一步监测1.8v、1.5v和1.0v电源纹波的时候,发现在低温下,1.0v电源纹波有明显的变大。而且,随着温度继续降低,该纹波会继续增大。当1.0v电源纹波增大到一定程度时候,单板出现复位。通过使用复位信号做触发,监测1.0v的纹波,发现1.0v纹波变大的时候,恰好是复位信号出现的时候,在时序上是可以对准的。
图1  单板复位信号和1.0v纹波信号
图2 单板复位信号和1.0v纹波信号放大
进一步测量1.0v纹波随温度变化情况:在环境温度降到<0度时候,1.0v纹波即开始变大;随着温度继续降低,纹波越来越大,直到纹波达到到200mv左右,单板复位。为验证是1.0电源纹波的问题,从1.0v电源的输出电感处,断开了单板上的1.0v dc-dc电源,用外部输入的1.0v电源灌入单板,替代原有的1.0v电源。实验发现,用外部电源后,单板在低温下,没有出现复位问题。对于用外部电源替代原有的1.0v电源,主要区别就是外部电源在温箱外面,不受温度变化影响,电源纹波一直稳定。所以,基本可以确定,主要就是1.0v电源纹波导致的单板复位。针对1.0v电源纹波问题,主要考虑:1、电源环路参数问题,导致在低温下环路不稳定,进而导致纹波增大。2、考虑是电源上用的外围器件,在低温下,器件参数变化,导致输出纹波增大。因为环路参数需要dcdc厂家支持配合验证,这里优先自行排查可能性2。针对这个问题,从芯片手册和收集的资料上看,确实有相关的解释:根据1.0v电源选择的dc-dc芯片的手册上看,输出的电源纹波和输出电容的esr以及开关频率、电感量l有关,具体如下:
图3 dc-dc输出纹波和输出电容esr的关系
这里fs是固定的430k,l 电感选择的是10uh ,输入输出的电压不变,在低温环境下测量dcdc开关频率和电感量l变化,排除这两参数影响。1.0v电源的电路如下:
图4  1.0v电源电路
这里选择的输出电容c166 是液态铝电解电容,在电容的手册中,没有提到电容的esr随温度变化的关系,从查到的资料看,液态铝电解电容的esr会随温度变化而变化。    通常,为了便于分析电容的esr,多用下图的简化方式来表示:
图5  电容简化图
导致esr变化两个常见因素是:
1)不良的电气连接;
2)电解溶液的干枯。
图6  液态铝电解电容esr和温度关系
从上面的图中可以看到,电容的esr随着温度的降低而增加。所以,对于该单板在低温下出现的1.0v电源纹波变大,导致的单板复位问题就可以解释了:在低温下,铝电解电容的电解液凝固,导致电容的esr增加。根据1.0v电源dc-dc芯片手册上的输出电压纹波公式可以知道,esr增加,必然导致输出电源的纹波增加,理论计算基本与现象符合。
三、解决方法
为此,要解决这个问题,关键是在低温下保持输出电容的esr值和常温保持不变。由于该电容的esr是由于电解液在低温下凝固而导致的,所以,选择了固态铝电解电容来替换。替换后,单板在低温下正常,不再复位。
四、总结
虽然最后的解决方法很简单,但整个定位的过程和解决方法,在以后实验中还是具有一定的借鉴作用。本文阐述的实践方法适用于单板上主要芯片功耗大,负载变化较大的单板;对于单板工作环境温度变化比较大的单板,在大电容选择的时候,可以参考。


人工智能遇到神经科学会有什么故事发生
5G商用有哪些进展看了就知道
AI独角兽优必选完成C轮融资8.2亿 寒武纪将推出云端AI芯片
2018CES上智能家居的巨头们怎么说:场景互联成新动向
大功率LED驱动电源厂商扎堆转战“全球”
【故障案例】CPU低温重启问题的定位和解决
列举六种常用的开关电源输入保护电路
影响LVDS端子使用寿命的因素
华为和中兴或躺枪 FCC禁止美国电信业采用“威胁国家安全”产品
单频与双频超声波清洗机到底有什么区别呢?
WK3027***-30G型DC-DC电源模块产品概述
人工智能在电力行业是如何应用的?
在电动汽车高速发展的时代,充电桩行业为何面临洗牌?
宝马大型纯电SUV iNEXT续航360英里
固态继电器应用电路
NTS对4Sight M传感器进行50G以上的机械冲击测试
挑选工业平板电脑时需要注意什么
宽温工业显示器的实现方式及优缺点
一键生成可视化图表/大屏 这13款数据可视化工具很强大
IP6805S英集芯5W无线充电发射端控制SoC芯片兼容WPC标准支持A11或A11a线圈