一、
現代的操作系統都可以有多個進程,而每一個進程都可以有多個線程;同一進程中的線程之間共享同一塊存儲空間,所以都可以訪問同一個全程變量等,而進程之間要通訊需要使用共享內存等手段。對操作系統來說,進程的開銷大,而線程則小得多。
關于進程較實質的定義﹕
1. 進程是程序的一次執行;
2. 進程是可以和別的計算器并發執行的計算;
3. 可定義為一個數據結構及能在其上進行操作的一個程序;
4. 一個程序及其數據在處理機上順序執行時所發生的活動;
5. 是程序在一個數據集合上的運行過程﹐是系統進行資源分配和調度的一個獨立單位。
綜合定義為﹕可并發執行的程序在一個數據集合上的運行過程。
對于線程﹕
比進程更小的能獨立運行的基本單位。進程和線程都是一個控制流程,線程也稱為輕量級的過程(lightweight process),因為他占用的系統資源更少,所以比進程更容易生成和銷毀。一個進程通常對應于一個程序(但程序是一個靜態的概念,進程是動態的)。而一個程序可以由多個不同的線程做成。
根據定義,進程為一個數據結構及能在其上進行的一次操作,它有兩個基本特征,一個是進程是可用有資源的獨立單位,第二個是進程同時又是一個可以獨立調度和分派的基本單位,這兩個基本屬性使之能夠獨立運行,也能夠并發運行。但是在并發運行的時候,系統還需要執行一系列操作:
1、需要創建進程,并為之分配其所必需的資源。
2、撤銷進程,對資源進行回收。
3、進程切換,它需要保留當前進程的CPU環境和設置新選中進程的CPU環境,為此需要花費不少處理時間。
正因為進程擁有資源,所以在并發執行進程的時候,在創建、撤銷和切換中,系統需要付出較大的開銷,因此,系統中設置的進程不能太多,進程切換的頻率也不能過高,這就限制了并發程度的提高。為了解決這一問題,于是產生并引入了線程概念。線程是進程中的一個實體,它的基本思想是將程序的執行和資源分開,只擁有一點必不可少的資源。一個進程可用有多個線程,但它可以和同屬于同一進程的其他線程共享進程所擁有的所有的資源,同一進程中的線程之間可以并發執行。這樣的話,并發程度可以獲得顯著的提高。線程也具有許多進程所具有的特征,因此被稱為輕型進程。
二、
多線程共存于應用程序中是現代操作系統中的基本特征和重要標志。用過UNIX操作系統的讀者知道進程,在UNIX操作系統中,每個應用程序的執行都在操作系統內核中登記一個進程標志,操作系統根據分配的標志對應用程序的執行進行調度和系統資源分配,但進程和線程有什么區別呢?
進程和線程都是由操作系統所體會的程序運行的基本單元,系統利用該基本單元實現系統對應用的并發性。進程和線程的區別在于:線程的劃分尺度小于進程,使得多線程程序的并發性高。另外,進程在執行過程中擁有獨立的內存單元,而多個線程共享內存,從而極大地提高了程序的運行效率。線程在執行過程中與進程還是有區別的。每個獨立的線程有一個程序運行的入口、順序執行序列和程序的出口。但是線程不能夠獨立執行,必須依存在應用程序中,由應用程序提供多個線程執行控制。從邏輯角度來看,多線程的意義在于一個應用程序中,有多個執行部分可以同時執行。但操作系統并沒有將多個線程看做多個獨立的應用,來實現進程的調度和管理以及資源分配。這就是進程和線程的重要區別。進程(Process)是最初定義在Unix等多用戶、多任務操作系統環境下用于表示應用程序在內存環境中基本執行單元的概念。以Unix操作系統為例,進程是Unix操作系統環境中的基本成分、是系統資源分配的基本單位。Unix操作系統中完成的幾乎所有用戶管理和資源分配等工作都是通過操作系統對應用程序進程的控制來實現的。
C、C++、Java等語言編寫的源程序經相應的編譯器編譯成可執行文件后,提交給計算機處理器運行。這時,處在可執行狀態中的應用程序稱為進程。從用戶角度來看,進程是應用程序的一個執行過程。從操作系統核心角度來看,進程代表的是操作系統分配的內存、CPU時間片等資源的基本單位,是為正在運行的程序提供的運行環境。進程與應用程序的區別在于應用程序作為一個靜態文件存儲在計算機系統的硬盤等存儲空間中,而進程則是處于動態條件下由操作系統維護的系統資源管理實體。多任務環境下應用程序進程的主要特點包括:
●進程在執行過程中有內存單元的初始入口點,并且進程存活過程中始終擁有獨立的內存地址空間;
●進程的生存期狀態包括創建、就緒、運行、阻塞和死亡等類型;
●從應用程序進程在執行過程中向CPU發出的運行指令形式不同,可以將進程的狀態分為用戶態和核心態。處于用戶態下的進程執行的是應用程序指令、處于核心態下的應用程序進程執行的是操作系統指令。
在Unix操作系統啟動過程中,系統自動創建swapper、init等系統進程,用于管理內存資源以及對用戶進程進行調度等。在Unix環境下無論是由操作系統創建的進程還要由應用程序執行創建的進程,均擁有唯一的進程標識(PID)。
三、進程與Java線程的區別:
應用程序在執行過程中存在一個內存空間的初始入口點地址、一個程序執行過程中的代碼執行序列以及用于標識進程結束的內存出口點地址,在進程執行過程中的每一時間點均有唯一的處理器指令與內存單元地址相對應。
Java語言中定義的線程(Thread)同樣包括一個內存入口點地址、一個出口點地址以及能夠順序執行的代碼序列。但是進程與線程的重要區別在于線程不能夠單獨執行,它必須運行在處于活動狀態的應用程序進程中,因此可以定義線程是程序內部的具有并發性的順序代碼流。
Unix操作系統和Microsoft Windows操作系統支持多用戶、多進程的并發執行,而Java語言支持應用程序進程內部的多個執行線程的并發執行。多線程的意義在于一個應用程序的多個邏輯單元可以并發地執行。但是多線程并不意味著多個用戶進程在執行,操作系統也不把每個線程作為獨立的進程來分配獨立的系統資源。進程可以創建其子進程,子進程與父進程擁有不同的可執行代碼和數據內存空間。而在用于代表應用程序的進程中多個線程共享數據內存空間,但保持每個線程擁有獨立的執行堆棧和程序執行上下文(Context)。
基于上述區別,線程也可以稱為輕型進程 (Light Weight Process,LWP)。不同線程間允許任務協作和數據交換,使得在計算機系統資源消耗等方面非常廉價。
線程需要操作系統的支持,不是所有類型的計算機都支持多線程應用程序。Java程序設計語言將線程支持與語言運行環境結合在一起,提供了多任務并發執行的能力。這就好比一個人在處理家務的過程中,將衣服放到洗衣機中自動洗滌后將大米放在電飯鍋里,然后開始做菜。等菜做好了,飯熟了同時衣服也洗好了。
需要注意的是:在應用程序中使用多線程不會增加 CPU 的數據處理能力。只有在多CPU 的計算機或者在網絡計算體系結構下,將Java程序劃分為多個并發執行線程后,同時啟動多個線程運行,使不同的線程運行在基于不同處理器的Java虛擬機中,才能提高應用程序的執行效率。