從圖上可以看到我們測試工具進程可以同時和多個目標進程通訊,也就是可以獲取任意進程窗口的文字信息。
這里就涉及到進程間通訊技術,一般來說最高效的是用內存映射文件,但是這里我們為了簡單,采用WM_COPYDATA消息,用WM_COPYDATA就涉及到窗口,顯然,我們這里的通訊窗口也應該采用一對多的形式,TAUtil.dll內有一個隱藏的主通訊窗口,另外每個目標進程的Detector.dll內有一個隱藏的輔助通訊窗口,主通訊窗口和輔助通訊窗口之間通過WM_COPYDATA通訊。
下面說下大概的流程:
1. TA Tool加載TAUtil.dll, TAUtil.dll創建主通訊窗口
2. TAUtil.dll在目標進程中創建RemoteThread, 目標進程加載Detector.dll, Detector.dll在Attatch時創建輔助通訊窗口
3. TAUtil.dll發消息給Detector.dll請求獲取目標窗口文字信息,然后等待
4. Detector.dll Hook 繪畫文字的API,然后請求目標窗口重畫窗口,重畫結束后卸載Hook,然后Detector.dll再將截獲到的文字發回給TAUtil.dll
5.TAUtil.dll收到文字信息后繼續執行.
這里有幾點要注意,一是主通訊窗口和輔助通訊窗口都要單獨的線程中運行,不然會阻塞主線程; 二是如何判斷文字是畫在目標窗口上的,我們可以通過WindowFromDC來判斷,但是對于內存DC,調用這個API時他會返回NULL, 這時我們就要跟蹤所有DC拷貝的API,這樣才能判斷最終文字是不是畫到了我們的目標窗口上. 如果我們要知道文字的繪畫位置,還要跟蹤DC拷貝的相對位置。windows繪畫文字的API包括DrawTextA, DrawTextW, DrawTextExA, DrawTextExW, ExtTextOutA, ExtTextOutW, TabbedTextOutA, TabbedTextOutW, PolyTextOutA, PolyTextOutW, TextOutA, TextOutW, DC拷貝的API包括BitBlt,TransparentBlt,PatBlt,StretchBlt等.
上面是屏幕取詞的實現原理, 接下來我們考慮如何操作目標進程菜單?
在考慮這個問題之前,我們先要知道Windows內部的對象類型, Windows的內部的對象類型分為GDI Object, User Object, Kernel Object, GDI Object包括Bitmap, Brush, DC, Pen 等,這些都只在該進程內有效; User Object包括HWND,HMENU等,這些對象是跨進程的,任何進程只要知道這個句柄值就可以操作它; Kernel Object 是系統共享的,包括進程句柄,線程句柄,Mutex,Event等,進程只要有權限,進程內核對象表中有該項,就可以訪問。
顯然,對于菜單,因為他是屬于用戶對象,外部進程只要得到它的HMENU就可以通過菜單相關的API來操作了。那么接下來我們的問題就是如何得到菜單句柄了. 方法同樣是API Hook ,我們只要Hook 系統API TrackPopupMenu和TrackPopupMenuEx就可以了, 大概流程是:
1. 安裝菜單相關的API Hook
2. 模擬鼠標點擊淡出菜單
3. 得到Hook 到的菜單句柄,卸載Hook
4 .通過菜單相關API查詢菜單內容,操作菜單
綜上,API Hook技術可以在自動化測試時可以實現我們平時測試時做不到的事情,通過目標進程的窗口層次和該技術結合,基本上可以將自動測試覆蓋率達到85%以上, 不能達到100%是因為有一部分UI信息是通過圖片來表現,這個涉及到圖像識別了。