題目:數組中有三個數只出現一次,其它的數恰好出現兩次,找出這三個數。
先考慮“只有兩個數出現一次”的情況:可以找到一種方法,將數組劃分為兩部分,且讓這兩個數分別在不同部分,這樣每部分所有數的異或值,恰好分別等于這兩個數。一種簡單的分法就是,先計算出這兩個數的異或值M(等價于求數組中所有數的異或值),求出M值的二進制表示中的最低位1(其它位的1也可以,只不過麻煩點)在 +k位,然后根據 +k位是否為1,將原數組分為兩部分。
回到原題,假設這三個不同的數是:A、B、C,它們的異或值 X = A xor B xor C,X值可能為0,也可能不為0。當X值不為0時(比如:這三個數為3、5、7,X值為1),很難找到一種方法,將原來的數組劃分為兩部分,使得這三個數不都在同一部分。因而,要先對原來的數組進行一次替換:將每個數與X進行異或。這樣原來的三個數就變成了:
B xor C、A xor C、A xor B。記a = B xor C、b = A xor C、c = A xor B。新的異或值 x = a xor b xor c = 0。
由于A、B、C互不相等,顯然它們間的異或值a、b、c都不為0,且互不相等。(若a等于b,則 0 = a xor b = (B xor C) xor (A xor C) = A xor B != 0自相矛盾)
若三個數的異或值為0,且其中一個數在 +n位(n為任意值)上為1,則另兩個數在 +n位上必然一個為1,另一個為0(不然的話,這三個數的異或值就不會為0),因而根據 +n位為1,可以將這三個數分成兩部分。
設f(x)為x的二進制表示中最低位1的位置,則f(a)、f(b)、f(c)這三個數中有且只有兩個數相等。證明:不妨設f(a)、f(b)、f(c)中最小的是f(a),k = f(a),則b、c在 +k位上必然是一個為1,一個為0,不妨設b在 +k位為1,則根據f(x)的定義以及f(a)最小,可得f(b)等于f(a),f(c)大于f(a)。因而,新數組的數x對應的所有f(x)的總異或值等于f(c)。
假設f(a)等于f(b),m = f(c),由于c在 +m位上為1,不妨設 b在 +m位也為1,則a在 +m位為0。根據 +m位是否為1,可將新數組分為兩部分,每部分的異或值恰好都是 a = B xor C,可以求出數A(等于a xor X)。 將數A放入原來的數組,問題轉為“只有兩個數出現一次”的情況,利用前面提到的方法算出另兩個數。總共需遍歷數組4次。
代碼:
#include <cstdio>
#include <cassert>
static inline int extract_rightmost_one(unsigned value) { return value & -value; }
// if a != b, m = extract_rightmost_one(a), n = extract_rightmost_one(b),
// k = extract_rightmost_one(a ^ b)
// then m == n != k or m == k != n or n == k != m
void print_three_unique_number(const int arr[], unsigned len)
{
assert (len >= 3 && len % 2);
const int* const beg = arr;
const int* const end = arr + len;
int xor3 = 0;
for (const int* p = beg; p != end; ++p) xor3 ^= *p;
int flag1 = 0;
for (const int* p = beg; p != end; ++p) flag1 ^= extract_rightmost_one(*p ^ xor3);
assert(flag1 != 0 && (flag1 & (flag1 - 1u)) == 0u); // flag1 == 2^^k
int xor2 = 0;
for (const int* p = beg; p != end; ++p) {
const int value = *p ^ xor3;
if (value & flag1) xor2 ^= value; //or:
// if ((value & flag1) == 0) xor2 ^= value;
}
const int number1 = xor2 ^ xor3;
const int flag2 = extract_rightmost_one(xor2);
int number2 = (number1 & flag2) ? number1 : 0; // put number1 into the array
for (const int* p = beg; p != end; ++p) {
if (*p & flag2) number2 ^= *p;
}
const int number3 = xor2 ^ number2;
printf("%d %d %d\n", number1, number2, number3);
}
上面的代碼并不嚴格符合C++標準,而是假定機器采用補碼表示負數(不采用補碼表示的老古董,一般人也碰不到)。 另外要特別注意的是,一些計算最好先轉為無符號數,避免溢出,最后再轉回有符號數。因為標準假定有符號數間的計算不發生溢出,當實際上發生溢出時,就是UB行為,編譯器若進行些激進的優化就得不到正確結果。