聯合(union)在C/C++里面見得并不多,但是在一些對內存要求特別嚴格的地方,聯合又是頻繁出現,那么究竟什么是聯合、怎么去用、有什么需要注意的地方呢?就這些問題,我試著做一些簡單的回答,里面肯定還有不當的地方,歡迎指出!
1、什么是聯合?
“聯合”是一種特殊的類,也是一種構造類型的數據結構。在一個“聯合”內可以定義多種不同的數據類型, 一個被說明為該“聯合”類型的變量中,允許裝入該“聯合”所定義的任何一種數據,這些數據共享同一段內存,已達到節省空間的目的(還有一個節省空間的類型:位域)。 這是一個非常特殊的地方,也是聯合的特征。另外,同struct一樣,聯合默認訪問權限也是公有的,并且,也具有成員函數。
2、聯合與結構的區別?
“聯合”與“結構”有一些相似之處。但兩者有本質上的不同。在結構中各成員有各自的內存空間, 一個結構變量的總長度是各成員長度之和(空結構除外,同時不考慮邊界調整)。而在“聯合”中,各成員共享一段內存空間, 一個聯合變量的長度等于各成員中最長的長度。應該說明的是, 這里所謂的共享不是指把多個成員同時裝入一個聯合變量內, 而是指該聯合變量可被賦予任一成員值,但每次只能賦一種值, 賦入新值則沖去舊值。
下面舉一個例了來加對深聯合的理解。
例4:
#include <stdio.h>
void main()
{
union number
{ /*定義一個聯合*/
int i;
struct
{ /*在聯合中定義一個結構*/
char first;
char second;
}half;
}num;
num.i=0x4241; /*聯合成員賦值*/
printf("%c%c\n", num.half.first, num.half.second);
num.half.first='a'; /*聯合中結構成員賦值*/
num.half.second='b';
printf("%x\n", num.i);
getchar();
}
輸出結果為:
AB
6261
從上例結果可以看出: 當給i賦值后, 其低八位也就是first和second的值; 當給first和second賦字符后, 這兩個字符的ASCII碼也將作為i 的低八位和高八位。
3、如何定義?
例如:
union test
{
test() { }
int office;
char teacher[5];
};
定義了一個名為test的聯合類型,它含有兩個成員,一個為整型,成員名office;另一個為字符數組,數組名為teacher。聯合定義之后,即可進行聯合變量說明,被說明為test類型的變量,可以存放整型量office或存放字符數組teacher。
4、如何說明?
聯合變量的說明有三種形式:先定義再說明、定義同時說明和直接說明。
以test類型為例,說明如下:
1) union test
{
int office;
char teacher[5];
};
union test a,b; /*說明a,b為test類型*/
2) union test
{
int office;
char teacher[5];
} a,b;
3) union
{
int office;
char teacher[5];
} a,b;
經說明后的a,b變量均為test類型。a,b變量的長度應等于test的成員中最長的長度,即等于teacher數組的長度,共5個字節。a,b變量如賦予整型值時,只使用了4個字節,而賦予字符數組時,可用5個字節。
5、如何使用?
對聯合變量的賦值,使用都只能是對變量的成員進行。聯合變量的成員表示為:
聯合變量名.成員名
例如,a被說明為test類型的變量之后,可使用a.class、a.office
不允許只用聯合變量名作賦值或其它操作,也不允許對聯合變量作初始化賦值,賦值只能在程序中進行。
還要再強調說明的是,一個聯合變量,每次只能賦予一個成員值。換句話說,一個聯合變量的值就是聯合變員的某一個成員值。
6、匿名聯合
匿名聯合僅僅通知編譯器它的成員變量共同享一個地址,而變量本身是直接引用的,不使用通常的點號運算符語法.例如:
#i nclude <iostream>
void main()
{
union{
int test;
char c;
};
test=5;
c=′a′;
std::cout<<i<<" "<<c;
}
正如所見到的,聯合成分象聲明的普通局部變量那樣被引用,事實上對于程序而言,這也正是使用這些變量的方式.另外,盡管被定義在一個聯合聲明中,他們與同一個程序快那的任何其他局部變量具有相同的作用域級別.這意味這匿名聯合內的成員的名稱不能與同一個作用域內的其他一直標志符沖突.
對匿名聯合還存在如下限制:
因為匿名聯合不使用點運算符,所以包含在匿名聯合內的元素必須是數據,不允許有成員函數,也不能包含私有或受保護的成員。還有,全局匿名聯合必須是靜態(static)的,否則就必須放在匿名名字空間中。
7、幾點需要討論的地方:
1、聯合里面那些東西不能存放?
我們知道,聯合里面的東西共享內存,所以靜態、引用都不能用,因為他們不可能共享內存。
2、類可以放入聯合嗎?
我們先看一個例子:
class Test
{
public:
Test():data(0) { }
private:
int data;
};
typedef union _test
{
Test test;
}UI;
編譯通不過,為什么呢?
因為聯合里不允許存放帶有構造函數、析夠函數、復制拷貝操作符等的類,因為他們共享內存,編譯器無法保證這些對象不被破壞,也無法保證離開時調用析夠函數。
3、又是匿名惹的禍??
我們先看下一段代碼:
class test
{
public:
test(const char* p);
test(int in);
const operator char*() const {return
data.ch;}
operator long() const {return data.l;}
private:
enum type {Int, String };
union
{
const char* ch;
int i;
}datatype;
type stype;
test(test&);
test& operator=(const test&);
};
test::test(const char *p):stype
(String),datatype.ch(p) { }
test::test(int in):stype(Int),datatype.l(i) {
}
看出什么問題了嗎?呵呵,編譯通不過。為什么呢?難道datatype.ch(p)和datatype.l(i)有問題嗎?
哈哈,問題在哪呢?讓我們來看看構造test對象時發生了什么,當創建test對象時,自然要調用其相應的構造函數,在構造函數中當然要調用其成員的構造函數,所以其要去調用datatype成員的構造函數,但是他沒有構造函數可調用,所以出
錯。
注意了,這里可并不是匿名聯合!因為它后面緊跟了個data!
4、如何有效的防止訪問出錯?
使用聯合可以節省內存空間,但是也有一定的風險:通過一個不適當的數據成員獲取當前對象的值!例如上面的ch、i交錯訪問。
為了防止這樣的錯誤,我們必須定義一個額外的對象,來跟蹤當前被存儲在聯合中的值得類型,我們稱這個額外的對象為:union的判別式。
一個比較好的經驗是,在處理作為類成員的union對象時,為所有union數據類型提供一組訪問函數。