Linux watchdog 6300esb



基本原理:

Linux 自带了一个 watchdog 的实现,用于监视系统的运行,包括一个内核 watchdog module 和一个用户空间的 watchdog 程序。内核 watchdog 模块通过 /dev/watchdog 这个字符设备与用户空间通信。用户空间程序一旦打开 /dev/watchdog 设备(俗称“开门放狗”),就会导致在内核中启动一个1分钟的定时器(系统默认时间),此后,用户空间程序需要保证在1分钟之内向这个设备写入数据(俗称“定期喂狗”),每次写操作会导致重新设定定时器。如果用户空间程序在1分钟之内没有写操作,定时器到期会导致一次系统 reboot 操作(“狗咬人了”呵呵)。通过这种机制,我们可以保证系统核心进程大部分时间都处于运行状态,即使特定情形下进程崩溃,因无法正常定时“喂狗”,Linux系统在看门狗作用下重新启动(reboot),核心进程又运行起来了。多用于嵌入式系统。

以上原理为watchdog的基本原理,其它类型的watchdog也是按照这个原理实现的。

实例测试:

比如测试通过的6300esb

设备情况如下:

[root@vm01 ~]# lspci
00:00.0 Host bridge: Intel Corporation 440FX - 82441FX PMC [Natoma] (rev 02)
00:01.0 ISA bridge: Intel Corporation 82371SB PIIX3 ISA [Natoma/Triton II]
00:01.1 IDE interface: Intel Corporation 82371SB PIIX3 IDE [Natoma/Triton II]
00:01.2 USB controller: Intel Corporation 82371SB PIIX3 USB [Natoma/Triton II] (rev 01)
00:01.3 Bridge: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 03)
00:02.0 VGA compatible controller: Cirrus Logic GD 5446
00:03.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 20)
00:04.0 Audio device: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) High Definition Audio Controller (rev 01)
00:05.0 Communication controller: Red Hat, Inc Virtio console
00:06.0 RAM memory: Red Hat, Inc Virtio memory balloon
00:07.0 System peripheral: Intel Corporation 6300ESB Watchdog Timer

[root@vm01 ~]# dmesg|grep 6300
i6300ESB timer: Intel 6300ESB WatchDog Timer Driver v0.04
i6300ESB timer: initialized (0xffffc90000e8c000). heartbeat=30 sec (nowayout=0)

[root@vm01 ~]# lsmod|grep softdog
[root@vm01 ~]# lsmod|grep watchdog
[root@vm01 ~]# ps -ef|grep watchdog
root         6     2  0 01:59 ?        00:00:00 [watchdog/0]
root      1748  1711  0 02:28 pts/0    00:00:00 grep watchdog

[root@vm01 ~]# lsmod|grep 6300
i6300esb                5669  0


整体程序如下:

#include <unistd.h>
#include <sys/stat.h>
#include <syslog.h>
#include <errno.h>
#include <sys/types.h>
#include <fcntl.h>
#include <stdlib.h>
#include <stdio.h>

int main(int argc,char** argv)
{
 //1、打开 /dev/watchdog 设备(“开门放狗”):
 int fd_watchdog = open("/dev/watchdog",O_WRONLY);
 
 if(fd_watchdog == -1)
 {
  int err = errno;
  printf("\n!! failed to open /dev/watchdog,errno:%d,%s \n",err,strerror(err));
  syslog(LOG_WARNING,"failed to open /dev/watchdog,errno:%d,%s",err,strerror(err));

 }
 
//2、每隔一段时间向 /dev/watchdog 设备写入数据(“定期喂狗”):
if(fd_watchdog >= 0)
{
 while(1)
 {
  sleep(10);
  static unsigned char food = 0;
  ssize_t earten = write(fd_watchdog,&food,1);
  if(earten != 1)
 {
 puts("\n!!! failed feeding watchdog");
 syslog(LOG_WARNING,"failted feeding watchdog");
 }
 }
 
}
close(fd_watchdog);

}

[root@vm01 watchdog]# gcc watchdog.c -o watchdog
[root@vm01 watchdog]# ./watchdog &
[1] 1790
[root@vm01 watchdog]#

使系统崩溃:

[root@vm01 ~]# echo c > /proc/sysrq-trigger

这时候系统会自动重新启动。

如果通过spice连接的系统,会看到先出现系统崩溃而出现的很多字符提示,一会系统就会重新启动。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。