編程之美1.5 快速找出故障機器
題目大意是這樣的:有很多服務器存儲數據,假設一個機器僅存儲一個標號為ID的記錄,假設機器總量在10億以下且ID是小于10億的整數,
假設每份數據保存兩個備份,這樣就有兩個機器存儲了同樣的數據。
問題是:1.假設在某個時間得到一個數據文件ID的列表,是否能快速地找出表中僅出現一次的ID?
即快速找出出現故障的機器存儲的數據ID。
2.如果有兩臺機器出現故障呢?(假設存儲同一份數據的兩臺機器不會同時出現故障,
即列表中缺少的是兩個不等的ID)
問題分析1:
首先考慮ID隊列中只有一個數字出現一次,其余的數字均出現兩次。
此時就可以借助異或運算符進行計算,a ^ a = 0 , 0^a =a 。
方法: 我們從數組的第一個元素開始,一直進行兩兩異或操作,則最后的結果即為缺失的機器ID。
問題2分析:
若是ID隊列中缺少了兩個數字,我們首先假設這兩個數字不相同,我們采取的方法是,依次進行異或操作,
則最后的結果不為0,設結果為a。則我們獲得a的二進制表示中,最低一位為1的位置,設該位置為b。
我們根據b位是否為1,將原來的id隊列,劃分為兩個隊列。
其中一個隊列中的b位為1,另一個隊列中的b位為0。然后對兩個分隊列,分別進行異或操作,則將得到
兩個不為0的數字。此兩個數字,即為所丟失的ID。
方法2:
若丟失的兩個ID是相同的,則我們無法使用上述方法。
此時我們采取的方法如下:
(1)首先計算出初始未丟失之前,所有ID之和。
(2)然后計算出丟失之后的ID之和,然后(1)(2)結果進行相減操作,則獲得的即為x+ y = a的值。
(3)我們還需要一個方程來求取x和y的值,我們可以用平方和來進行計算。
(4)利用丟失前后平方和之差,來與(2)進行聯立,來求取x和y的值。x * x + y * y = b的值/
(5) 對方程(2)(4)進行聯立,即可以求出最終的結果。
三 相似問題
從一副撲克牌中(無大小王),抽取出一張牌,我們進行快速的判斷,來猜測這些抽取的是哪張牌。
四 問題加深
若是每個id,三個電腦存儲,丟失了3個id,則是否還能使用上述方法,得出最后的結果。
則我們需要建立三個方程,可以利用所有的數,前后相乘的積,來建立第三個方程。
若是N個id呢,只需要建立n個方程,即可達到目的。