排查死鎖的 4 種工具,秀~

作者 | 磊哥

來源 | Java 中文社羣(ID:javacn666)

死鎖(Dead Lock)指的是兩個或兩個以上的運算單元(進程、線程或協程),都在等待對方停止執行,以取得系統資源,但是沒有一方提前退出,就稱爲死鎖。

死鎖示例

接下來,我們先來演示一下 Java 中最簡單的死鎖,我們創建兩個鎖和兩個線程,讓線程 1 先擁有鎖 A,然後在 1s 後嘗試獲取鎖 B,同時我們啓動線程 2,讓它先擁有鎖 B,然後在 1s 之後嘗試獲取鎖 A,這時就會出現相互等待對方釋放鎖的情況,從而造成死鎖的問題,具體代碼如下:

publicclass DeadLockExample {
    public static void main(String[] args) {
        Object lockA = new Object(); // 創建鎖 A
        Object lockB = new Object(); // 創建鎖 B

        // 創建線程 1
        Thread t1 = new Thread(new Runnable() {
            @Override
            public void run() {
                // 先獲取鎖 A
                synchronized (lockA) {
                    System.out.println("線程 1:獲取到鎖 A!");
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    // 嘗試獲取鎖 B
                    System.out.println("線程 1:等待獲取 B...");
                    synchronized (lockB) {
                        System.out.println("線程 1:獲取到鎖 B!");
                    }
                }
            }
        });
        t1.start(); // 運行線程

        // 創建線程 2
        Thread t2 = new Thread(new Runnable() {
            @Override
            public void run() {
                // 先獲取鎖 B
                synchronized (lockB) {
                    System.out.println("線程 2:獲取到鎖 B!");
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    // 嘗試獲取鎖 A
                    System.out.println("線程 2:等待獲取 A...");
                    synchronized (lockA) {
                        System.out.println("線程 2:獲取到鎖 A!");
                    }
                }
            }
        });
        t2.start(); // 運行線程
    }
}

以上程序的執行結果如下:

從上述結果可以看出,線程 1 和線程 2 都在等待對方釋放鎖,這樣就造成了死鎖問題。

死鎖產生原因

通過以上示例,我們可以得出結論,要產生死鎖需要滿足以下 4 個條件

  1. 互斥條件:指運算單元(進程、線程或協程)對所分配到的資源具有排它性,也就是說在一段時間內某個鎖資源只能被一個運算單元所佔用。

  2. 請求和保持條件:指運算單元已經保持至少一個資源,但又提出了新的資源請求,而該資源已被其它運算單元佔有,此時請求運算單元阻塞,但又對自己已獲得的其它資源保持不放。

  3. 不可剝奪條件:指運算單元已獲得的資源,在未使用完之前,不能被剝奪。

  4. 環路等待條件:指在發生死鎖時,必然存在運算單元和資源的環形鏈,即運算單元正在等待另一個運算單元佔用的資源,而對方又在等待自己佔用的資源,從而造成環路等待的情況。

只有以上 4 個條件同時滿足,纔會造成死鎖問題。

死鎖排查

如果程序出現死鎖問題,可通過以下 4 種方案中的任意一種進行分析和排查。

方案 1:jstack

我們在使用 jstack 之前,先要通過 jps 得到運行程序的進程 ID,使用方法如下:

“jps -l” 可以查詢本機所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一個顯示當前所有 Java 進程 pid 的命令,適合在 linux/unix/windows 平臺上簡單察看當前 Java 進程的一些簡單情況,“-l” 用於輸出進程 pid 和運行程序完整路徑名(包名和類名)。

有了進程 ID(PID)之後,我們就可以使用 “jstack -l PID” 來發現死鎖問題了,如下圖所示:

jstack 用於生成 Java 虛擬機當前時刻的線程快照,“-l” 表示長列表(long),打印關於鎖的附加信息。

PS:可以使用 jstack -help 查看更多命令使用說明。

方案 2:jconsole

使用 jconsole 需要打開 JDK 的 bin 目錄,找到 jconsole 並雙擊打開,如下圖所示:

然後選擇要調試的程序,如下圖所示:

之後點擊連接進入,選擇 “不安全的連接” 進入監控主頁,如下圖所示:

之後切換到 “線程” 模塊,點擊 “檢測死鎖” 按鈕,如下圖所示:

之後稍等片刻就會檢測出死鎖的相關信息,如下圖所示:

方案 3:jvisualvm

jvisualvm 也在 JDK 的 bin 目錄中,同樣是雙擊打開:

稍等幾秒之後,jvisualvm 中就會出現本地的所有 Java 程序,如下圖所示:

雙擊選擇要調試的程序:

單機鼠標進入 “線程” 模塊,如下圖所示:

從上圖可以看出,當我們切換到線程一欄之後就會直接顯示出死鎖信息,之後點擊 “線程 Dump” 生成死鎖的詳情信息,如下圖所示:

方案 4:jmc

jmc 是 Oracle Java Mission Control 的縮寫,是一個對 Java 程序進行管理、監控、概要分析和故障排查的工具套件。它也是在 JDK 的 bin 目錄中,同樣是雙擊啓動,如下圖所示:

jmc 主頁信息如下:

之後選中要排查的程序,右鍵 “啓動 JMX 控制檯” 查看此程序的詳細內容,如下圖所示:

然後點擊 “線程”,勾中“死鎖檢測” 就可以發現死鎖和死鎖的詳情信息,如下圖所示:

總結

死鎖是因爲兩個或兩個以上的運算單元,都在等待對方停止執行,以取得系統資源,但沒有一方提前退出,於是就出現了死鎖。死鎖的排查工具總共有 4 種:

從易用性和性能方面來考慮,推薦使用 jconsole 或 jvisualvm 來排查死鎖。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/bjdirYIH9bJPVUawJ9X8iQ