Android中的WatchDog

<!-- lixianjing added -->

转载时请注明出处和作者联系方式
文章出处:http://www.limodev.cn/blog
作者联系方式:李先静 <xianjimli@gmail.com>

现在的CPU基本上都带有WatchDog功能,这种硬件的WatchDog可以在系统死掉(死锁或者程序跑飞)后重启系统,让系统回到可以工作的状态。WatchDog不能防止系统死掉,但是它能够起死回生,从而提高系统的可用性。

硬件级的WatchDog也有它的局限性,它只能在系统范围内生效,不能针对单个进程,某个进程死掉了,WatchDog未必知道。对于像Linux这类久经考验的操作系统来说,整个系统死掉概率非常低,所以此时硬件级的WatchDog意义反而不大。

Android 平台实现了一个软件的WatchDog来监护SystemServer。SystemServer无疑是Android平台中最重要的进程了,里面运行了整个平台中绝大多数的服务。在这个进程中运行着近50个线程,任何一个线程死掉都可能导致整个系统死掉。SystemServer退出反而问题不大,因为 init进程会重新启动它,但是它死锁就麻烦了,因为整个系统就没法动了。

在 SystemServer里运行的服务中,最重要的几个服务应该数ActivityManager、WindowManager和 PowerManager。软件的WatchDog主要就是确保这几个服务发生死锁之后,退出SystemServer进程,让init进程重启它,让系统回到可用状态。

每个被监护的Service必须实现Watchdog.Monitor接口,这个接口只要实现一个函数monitor,这个函数实现非常简单,就拿ActivityManager来说吧:

public void monitor() {       synchronized (this) { }    }

它去锁一下对象,什么也不做,然后就返回。如果对象没有死锁,这个过程就会很顺利。如果对象死锁了,这个函数就会挂在这里。

当然实现Watchdog.Monitor接口还不够,还要把它注册到WatchDog服务中,在初始化时加这样一行代码就行了:

Watchdog.getInstance().addMonitor(this);

最后我们看看WatchDog服务的实现。WatchDog服务包括两个方面:

1.定期调用被监护对象的monitor函数,这是在主线程中完成的。如果被监护对象死锁,则会阻塞在这里。

                   final int size = mMonitors.size();                   for (int i = 0 ; i < size ; i++) {                       mCurrentMonitor = mMonitors.get(i);                       mCurrentMonitor.monitor();                   }

2.检测是否发生死锁,这是在Watchdog线程中运行的。如果发生死锁而且没有被调试,则退出SystemServer,init进程就会重启SystemServer进程。

           // Only kill the process if the debugger is not attached.           if (!Debug.isDebuggerConnected()) {               Slog.w(TAG, "*** WATCHDOG KILLING SYSTEM PROCESS: " + name);               Process.killProcess(Process.myPid());               System.exit(10);           } else {               Slog.w(TAG, "Debugger connected: Watchdog is *not* killing the system process");           }

最近我们碰到一个问题,SystemServer不断重启:原来wifi模块死锁了,此时重启SystemServer,但是重启之后马上又死锁了,结果成了一个死循环。在这种情况下,我想还是在重启系统会好点。

http://www.limodev.cn/blog/archives/1566


更多相关文章

  1. [转]Android 技术专题系列之九 -- 图形系统
  2. 【自学Android】使用ModelView,DataBinding,LiveData开发计分板A
  3. Android 的GUI 系统
  4. Android系统信息与安全机制
  5. Android调用系统分享,资源未找到问题
  6. android系统权限关机重启
  7. Android模拟、实现、触发系统按键事件的方法
  8. android 日期时间格式转换;软键盘显示消失;获取系统title

随机推荐

  1. android程序执行adb shell命令
  2. AudioManager音量控制
  3. Android开发指南整理
  4. android opensource webs
  5. Android逆向基础之Dalvik指令集
  6. Android(安卓)连接加密网络
  7. android 短信拦截
  8. android 入门学习笔记 Button 常用的弹窗
  9. Android多分辨率适配
  10. Android(安卓)studio的点击事件