Cisco Cisco Content Delivery Engine 250 Guida All'Installazione

Pagina di 11
 
 
   SR-624697161 - CDE250 Load testing threshold with smooth streaming  
   SR-623663571:  Rootfs partition out of free inodes  
 
The later SR (623663571)
 
was resolved by fixing the following Cisco defect  
(resolved in Release 3.1.2 and beyond): 
 
CSCud57383:  sysmo n robustness against sdt hangs  
 
While the software fix for this defect does not resolve the core underlying IPMI error 
messages (more on this later), it does significantly reduce the frequency of their occurrence 
by slowing down the execution interval of the Supero Doctor (sdt) hardware health 
monitoring utility from 5 minutes to 30 minutes (i.e.,  sdt is now run every 30 minutes).     
sdt  calls into the IPMI firmware layer to retrieve hardware health information (primarily 
power-supply status / fan speeds, and various  motherboard temperatures / voltages).    
 
[ Given that most hardware health characteristics (e.g., fan speeds, temperatures, voltages) 
normally change at a slow rate, it is desirable to reduce the load on the IPMI subsystem by 
polling hardware health status only when necessary (i.e., every 30 minutes).  If there is an 
abrupt change in hardware health, the CDE250 motherboard itself has  failsafe circuitry to 
alarm and (if necessary) automatically power-off the system.
 ]
 
 
This software fix also properly cleans up / preserves file system resources (in the event the 
sdt utility hangs indefinitely due to the above IPMI issue), thereby preventing inodes from 
being depleted from the rootfs partition. 
 
The root-cause of the underlying IPMI error messages is being actively researched by both 
Cisco and the CDE250 system vendor.   Upgrading the IPMI firmware to v2.05 will  serve to 
mitigate the risk of this IPMI Watchdog condition occurring, while at the same time 
improving the stability of the IPMI / BMC subsystem.    
 
At the present time, the only known work-around for this issue is to power-cycle the system.    
This would suggest that it might be an issue with the BMC controller hardware itself.   By 
cold-restarting the system, any BMC lockup / instability issues are properly cleared upon 
subsequent power-up.    The recommended way to reliably know if the power-cycle / reboot 
has cleared this issue is to execute a “show tech” CLI command.    If the command does 
not hang at the “system health” section (this is the output from sdt), then the system 
booted cleanly and should be free of any subsequent IPMI Watchdog issues. 
 
3)  POST Boot Hang and POST after system reboot. 
After the CDE250 has been running for 24+ hours and a reboot command is issued the 
system will hang during POST with 5 short and 1 long beep.  This pattern is a POST boot 
error code: