新聞中心
為什么需要線程?

如果非要說(shuō)是為什么需要線程,還不如說(shuō)為什么需要進(jìn)程中還有其它進(jìn)程。這些進(jìn)程中包含的其它迷你進(jìn)程就是線程。
線程之所以說(shuō)是迷你進(jìn)程,是因?yàn)榫€程和進(jìn)程有很多相似之處,比如線程和進(jìn)程的狀態(tài)都有運(yùn)行,就緒,阻塞狀態(tài)。這幾種狀態(tài)理解起來(lái)非常簡(jiǎn)單,當(dāng)進(jìn)程所需的資源沒(méi)有到位時(shí)會(huì)是阻塞狀態(tài),當(dāng)進(jìn)程所需的資源到位時(shí)但CPU沒(méi)有到位時(shí)是就緒狀態(tài),當(dāng)進(jìn)程既有所需的資源,又有CPU時(shí),就為運(yùn)行狀態(tài)。
下面我們來(lái)看一個(gè)具體的例子:
就拿我寫博客的LiveWriter來(lái)說(shuō),LiveWriter需要監(jiān)聽(tīng)我打字輸入的狀態(tài),還需要每隔5分鐘對(duì)草稿進(jìn)行自動(dòng)保存。假設(shè)如果這個(gè)進(jìn)程只有一個(gè)線程的話,那么當(dāng)對(duì)草稿進(jìn)行保存時(shí),因?yàn)榇藭r(shí)需要訪問(wèn)硬盤,而訪問(wèn)硬盤的時(shí)間線程是阻塞狀態(tài)的,這時(shí)我的任何輸入都會(huì)沒(méi)有響應(yīng),這種用戶體驗(yàn)是無(wú)法接受的,或許我們可以通過(guò)鍵盤或者鼠標(biāo)的輸入去中斷保存草稿的過(guò)程,但這種方案也并不討好。而使用多線程,每個(gè)線程僅僅需要處理自己那一部分應(yīng)該完成的任務(wù),而不用去關(guān)心和其它線程的沖突。因此簡(jiǎn)化了編程模型。如圖1所示。
圖1.兩條線程滿足各自的功能
更具體的說(shuō),線程的好處如下:
1.在很多程序中,需要多個(gè)線程互相同步或互斥的并行完成工作,而將這些工作分解到不同的線程中去無(wú)疑簡(jiǎn)化了編程模型。
2.因?yàn)榫€程相比進(jìn)程來(lái)說(shuō),更加的輕量,所以線程的創(chuàng)建和銷毀的代價(jià)變得更小。
3.線程提高了性能,雖然線程宏觀上是并行的,但微觀上卻是串行。從CPU角度線程并無(wú)法提升性能,但如果某些線程涉及到等待資源(比如IO,等待輸入)時(shí),多線程允許進(jìn)程中的其它線程繼續(xù)執(zhí)行而不是整個(gè)進(jìn)程被阻塞,因此提高了CPU的利用率,從這個(gè)角度會(huì)提升性能。
4.在多CPU或多核的情況下,使用線程不僅僅在宏觀上并行,在微觀上也是并行的。
這里值得注意的是,上面的兩個(gè)線程如果改成兩個(gè)進(jìn)程,那么達(dá)不到所要的效果,因?yàn)檫M(jìn)程有自己獨(dú)立的內(nèi)存地址空間,而線程共享進(jìn)程的內(nèi)存地址空間。
經(jīng)典線程模型
另一個(gè)看進(jìn)程和線程的角度是進(jìn)程模型基于兩類不同的概念:資源的組織和執(zhí)行。在過(guò)去沒(méi)有線程的操作系統(tǒng)中,資源的組織和執(zhí)行都是由進(jìn)程完成的。但區(qū)分這兩者很多時(shí)候需要加以區(qū)分,這也是為什么需要引入線程。
進(jìn)程是用于組織資源的單位,進(jìn)程將相關(guān)的資源組織在一起,這些資源包括:內(nèi)存地址空間,程序,數(shù)據(jù)等,將這些以進(jìn)程的形式組織起來(lái)可以使得操作系統(tǒng)管理這些資源更為容易。
而線程,是每一個(gè)進(jìn)程中執(zhí)行的一個(gè)條線。線程雖然共享進(jìn)程中的大多數(shù)資源,但線程也需要自己的一些資源,比如:用于標(biāo)識(shí)下一條執(zhí)行指令的程序計(jì)數(shù)器,一些容納局部變量的寄存器,以及用于表示執(zhí)行的歷史的棧。
總而言之:進(jìn)程是組織資源的最小單位,而線程是安排CPU執(zhí)行的最小單位。
其實(shí)在一個(gè)進(jìn)程中多個(gè)線程并行和在操作系統(tǒng)中多個(gè)進(jìn)程并行非常類似,只是線程共享的是地址空間,而進(jìn)程共享的是物理內(nèi)存,打印機(jī),鍵盤等資源……
每一個(gè)進(jìn)程和線程所獨(dú)自占有的資源如表1所示。
| 進(jìn)程占有的資源 | 線程占有的資源 |
| 地址空間 全局變量 打開(kāi)的文件 子進(jìn)程 信號(hào)量 賬戶信息 |
棧 寄存器 狀態(tài) 程序計(jì)數(shù)器 |
表1.進(jìn)程和線程所獨(dú)占的資源
其中,線程可以共享進(jìn)程獨(dú)占的資源。
我們常用的術(shù)語(yǔ)“多線程”一般指的是在同一個(gè)進(jìn)程中多個(gè)線程的并發(fā)執(zhí)行。如圖2所示。
圖2.沒(méi)有多線程的系統(tǒng)一個(gè)進(jìn)程只能由一個(gè)線程
在多線程的進(jìn)程中,每個(gè)線程輪流使用CPU,因此實(shí)際上線程并不是并行的,但從宏觀上看,是并行的。
在多線程模型中,每一個(gè)進(jìn)程初始創(chuàng)建時(shí)只有一個(gè)線程。這個(gè)線程可以通過(guò)調(diào)用系統(tǒng)的庫(kù)函數(shù)去創(chuàng)建其它線程。線程創(chuàng)建的線程并必須要為其指定地址,因?yàn)樾碌木€程自動(dòng)在創(chuàng)建它的地址空間內(nèi)工作。雖然一個(gè)線程可以創(chuàng)建另一個(gè)線程,但通常來(lái)講,線程之間是并列的,并不存在層級(jí)關(guān)系。
當(dāng)一個(gè)進(jìn)程完成其工作后,可以通過(guò)調(diào)用系統(tǒng)庫(kù)函數(shù)進(jìn)行銷毀。
操作系統(tǒng)實(shí)現(xiàn)線程的幾種模式
在操作系統(tǒng)中,線程可以實(shí)現(xiàn)在用戶模式下,也可以實(shí)現(xiàn)在內(nèi)核模式下,也可以兩者結(jié)合實(shí)現(xiàn)。
線程實(shí)現(xiàn)在用戶空間下
當(dāng)線程在用戶空間下實(shí)現(xiàn)時(shí),操作系統(tǒng)對(duì)線程的存在一無(wú)所知,操作系統(tǒng)只能看到進(jìn)程,而不能看到線程。所有的線程都是在用戶空間實(shí)現(xiàn)。在操作系統(tǒng)看來(lái),每一個(gè)進(jìn)程只有一個(gè)線程。過(guò)去的操作系統(tǒng)大部分是這種實(shí)現(xiàn)方式,這種方式的好處之一就是即使操作系統(tǒng)不支持線程,也可以通過(guò)庫(kù)函數(shù)來(lái)支持線程。
在這種模式下,每一個(gè)進(jìn)程中都維護(hù)著一個(gè)線程表來(lái)追蹤本進(jìn)程中的線程,這個(gè)表中包含表1中每個(gè)線程獨(dú)占的資源,比如棧,寄存器,狀態(tài)等,如圖3所示。
圖3.在用戶空間中實(shí)現(xiàn)線程
這種模式當(dāng)一個(gè)線程完成了其工作或等待需要被阻塞時(shí),其調(diào)用系統(tǒng)過(guò)程阻塞自身,然后將CPU交由其它線程。
這種的模式的好處,首先,是在用戶空間下進(jìn)行進(jìn)程切換的速度要遠(yuǎn)快于在操作系統(tǒng)內(nèi)核中實(shí)現(xiàn)。其次,在用戶空間下實(shí)現(xiàn)線程使得程序員可以實(shí)現(xiàn)自己的線程調(diào)度算法。比如進(jìn)程可以實(shí)現(xiàn)垃圾回收器來(lái)回收線程。還有,當(dāng)線程數(shù)量過(guò)多時(shí),由于在用戶空間維護(hù)線程表,不會(huì)占用大量的操作系統(tǒng)空間。
有好處就有壞處,這種模式最致命的缺點(diǎn)也是由于操作系統(tǒng)不知道線程的存在,因此當(dāng)一個(gè)進(jìn)程中的某一個(gè)線程進(jìn)行系統(tǒng)調(diào)用時(shí),比如缺頁(yè)中斷而導(dǎo)致線程阻塞,此時(shí)操作系統(tǒng)會(huì)阻塞整個(gè)進(jìn)程,即使這個(gè)進(jìn)程中其它線程還在工作。還有一個(gè)問(wèn)題是假如進(jìn)程中一個(gè)線程長(zhǎng)時(shí)間不釋放CPU,因?yàn)橛脩艨臻g并沒(méi)有時(shí)鐘中斷機(jī)制,會(huì)導(dǎo)致此進(jìn)程中的其它線程得不到CPU而持續(xù)等待。
線程實(shí)現(xiàn)在操作系統(tǒng)內(nèi)核中
在這種模式下,操作系統(tǒng)知道線程的存在。此時(shí)線程表存在操作系統(tǒng)內(nèi)核中,如圖4所示。
圖4.線程在操作系統(tǒng)內(nèi)核中實(shí)現(xiàn)
在這種模式下,所有可能阻塞線程的調(diào)用都以系統(tǒng)調(diào)用(System Call)的方式實(shí)現(xiàn),相比在用戶空間下實(shí)現(xiàn)線程造成阻塞的運(yùn)行時(shí)調(diào)用(System runtime call)成本會(huì)高出很多。當(dāng)一個(gè)線程阻塞時(shí),操作系統(tǒng)可以選擇將CPU交給同一進(jìn)程中的其它線程,或是其它進(jìn)程中的線程,而在用戶空間下實(shí)現(xiàn)線程時(shí),調(diào)度只能在本進(jìn)程中執(zhí)行,直到操作系統(tǒng)剝奪了當(dāng)前進(jìn)程的CPU。
因?yàn)樵趦?nèi)核模式下實(shí)現(xiàn)進(jìn)程的成本更高,一個(gè)比較好的做法是另線程回收利用,當(dāng)一個(gè)線程需要被銷毀時(shí),僅僅是修改標(biāo)記位,而不是直接銷毀其內(nèi)容,當(dāng)一個(gè)新的線程需要被創(chuàng)建時(shí),也同樣修改被“銷毀”的線程其標(biāo)記位即可。
這種模式下同樣還是有一些弊端,比如接收系統(tǒng)信號(hào)的單位是進(jìn)程,而不是線程,那么由進(jìn)程中的哪一個(gè)線程接收系統(tǒng)信號(hào)呢?如果使用了表來(lái)記錄,那么多個(gè)線程注冊(cè)則通過(guò)哪一個(gè)線程處理系統(tǒng)信號(hào)?
混合模式
還有一種實(shí)現(xiàn)方式是將上面兩種模式進(jìn)行混合,用戶空間中進(jìn)程管理自己的線程,操作系統(tǒng)內(nèi)核中有一部分內(nèi)核級(jí)別的線程,如圖5所示。
圖5.混合模式
在這種模式下,操作系統(tǒng)只能看到內(nèi)核線程。用戶空間線程基于操作系統(tǒng)線程運(yùn)行。因此,程序員可以決定使用多少用戶空間線程以及操作系統(tǒng)線程,這無(wú)疑具有更大的靈活性。而用戶空間線程的調(diào)度和前面所說(shuō)的在用戶空間下執(zhí)行實(shí)現(xiàn)線程是一樣的,同樣可以自定義實(shí)現(xiàn)。
當(dāng)前文章:操作系統(tǒng)中的進(jìn)程與線程
文章地址:http://fisionsoft.com.cn/article/djcjoid.html


咨詢
建站咨詢
