新聞中心
Linux操作系統(tǒng)是目前世界范圍內(nèi)廣泛應(yīng)用的一種開(kāi)源系統(tǒng),其內(nèi)核作為操作系統(tǒng)的核心組成部分承載著操作系統(tǒng)的全部功能,使得操作系統(tǒng)得以運(yùn)行各種應(yīng)用程序。在Linux內(nèi)核中,_read是其中一個(gè)重要的函數(shù),其在數(shù)據(jù)操作和文件讀寫(xiě)中扮演著非常重要的角色。本文將從_read函數(shù)的作用和實(shí)現(xiàn)方式兩個(gè)方面來(lái)探索Linux內(nèi)核。

一、_read函數(shù)的作用
_read是Linux文件系統(tǒng)中的一個(gè)函數(shù),主要用于操作文件的讀取操作。當(dāng)我們?cè)谙到y(tǒng)中進(jìn)行讀操作時(shí),_read函數(shù)將會(huì)被調(diào)用,該函數(shù)會(huì)檢查我們傳遞給它的參數(shù),找到所期望的數(shù)據(jù)塊,然后將其從磁盤(pán)中讀出來(lái),并將其存儲(chǔ)在用戶空間中以供使用。
具體來(lái)說(shuō),當(dāng)用戶請(qǐng)求_read函數(shù)從文件中讀取數(shù)據(jù)時(shí),_read就會(huì)進(jìn)入以下步驟:
1. _read函數(shù)會(huì)查找文件的索引節(jié)點(diǎn),并獲取其相關(guān)屬性(例如文件大小和塊的大?。?/p>
2. 接著,_read函數(shù)會(huì)檢查用戶請(qǐng)求的數(shù)據(jù)塊是否為當(dāng)前的塊,并根據(jù)需要在磁盤(pán)中尋找該塊;
3. 如果找到了該塊,_read函數(shù)就會(huì)將其從磁盤(pán)中讀出來(lái),并存儲(chǔ)在一個(gè)適當(dāng)?shù)膬?nèi)存緩存區(qū)中;
4. _read函數(shù)將數(shù)據(jù)塊復(fù)制到用戶的緩存區(qū)中,以便用戶可以對(duì)其進(jìn)行操作和使用。
因此,_read函數(shù)的作用就是完成了Linux文件系統(tǒng)中讀取數(shù)據(jù)的基本操作,為應(yīng)用程序提供了必要的數(shù)據(jù)。
二、_read函數(shù)的實(shí)現(xiàn)方式
_read函數(shù)的實(shí)現(xiàn)方式取決于所使用的文件系統(tǒng)和內(nèi)核版本。在Linux內(nèi)核的早期版本中,該函數(shù)的實(shí)現(xiàn)方式是通過(guò)調(diào)用底層的磁盤(pán)讀取函數(shù)來(lái)完成的。但是,在隨后的內(nèi)核版本中,這種方式被認(rèn)為是不夠有效的,因?yàn)樗鼘?duì)磁盤(pán)進(jìn)行了大量的讀取和寫(xiě)入,從而導(dǎo)致了性能下降。
為此,新的實(shí)現(xiàn)方式通過(guò)使用內(nèi)存緩存技術(shù)來(lái)提高性能。在這種情況下,_read函數(shù)會(huì)將數(shù)據(jù)塊存儲(chǔ)在內(nèi)存緩存中,以便在以后的讀操作中直接使用。這種實(shí)現(xiàn)方式的基本思路是:在文件系統(tǒng)被掛載時(shí),內(nèi)存緩存會(huì)被預(yù)先填充,以便在以后的操作中提供快速訪問(wèn)。
三、
_read是Linux文件系統(tǒng)中非常重要的一個(gè)函數(shù),它提供了文件數(shù)據(jù)的讀取功能。理解_read函數(shù)的作用和實(shí)現(xiàn)方式有助于我們更好地了解Linux內(nèi)核的工作原理和性能優(yōu)化方法。雖然_read函數(shù)的實(shí)現(xiàn)方式幾乎是每個(gè)內(nèi)核版本都不同,但是其本質(zhì)功能沒(méi)有改變,因此,對(duì)_read函數(shù)的研究可以使我們更好地理解Linux操作系統(tǒng)。
相關(guān)問(wèn)題拓展閱讀:
- linux內(nèi)核同步問(wèn)題
linux內(nèi)核同步問(wèn)題
Linux內(nèi)核設(shè)計(jì)與實(shí)現(xiàn) 十、內(nèi)核同步方法
手把手教Linux驅(qū)動(dòng)5-自旋鎖、信號(hào)量、互斥體概述
==
基礎(chǔ)概念:
==
并發(fā)
:多個(gè)執(zhí)行單元同時(shí)進(jìn)行或多個(gè)執(zhí)行單元微觀串行執(zhí)行,宏謹(jǐn)拿觀并行執(zhí)行
競(jìng)態(tài)
:并發(fā)的執(zhí)行單元對(duì)共享資源(硬件資源和軟件上的全局變量)的訪問(wèn)而導(dǎo)致的竟態(tài)狀態(tài)。
臨界資源
:多個(gè)進(jìn)程訪問(wèn)的資源
臨界區(qū)
:多個(gè)進(jìn)程訪問(wèn)的代碼段
==
并發(fā)場(chǎng)合:
==
1、單CPU之間進(jìn)程間的并發(fā)
:時(shí)間片輪轉(zhuǎn),調(diào)度進(jìn)程。 A進(jìn)程訪問(wèn)打印機(jī),時(shí)間片用完,OS調(diào)度B進(jìn)程訪問(wèn)打印機(jī)。
2、單cpu上進(jìn)程和中斷之間并發(fā)
:CPU必須停止當(dāng)前進(jìn)程的執(zhí)行中斷;
3、多cpu之間
4、單CPU上中斷之間的并發(fā)
==
使用偏向:
==
==信號(hào)量用于進(jìn)程之間的同步,進(jìn)程在信號(hào)量保護(hù)的臨界區(qū)代碼里面是可以睡眠的(需要進(jìn)行進(jìn)程調(diào)度),這是與自旋鎖更大的區(qū)別。==
信號(hào)量又稱為信號(hào)燈,它是用來(lái)協(xié)調(diào)不同進(jìn)程間的數(shù)據(jù)對(duì)象的,而最主要的應(yīng)用是共享內(nèi)存方式的進(jìn)程間通信。本質(zhì)上,信號(hào)量是一個(gè)計(jì)數(shù)器,它用來(lái)記錄對(duì)某個(gè)資源(如共享內(nèi)存)的存取狀況。它負(fù)責(zé)協(xié)調(diào)各個(gè)進(jìn)程,以保證他們能夠正確、合理的使用公共資源。它和spin lock更大的不同之處就是:無(wú)法獲取信號(hào)量的進(jìn)程可以睡眠祥李搭,因此會(huì)導(dǎo)致系統(tǒng)調(diào)度。
1、==用于進(jìn)程與進(jìn)程之間的同步==
2、==允許多個(gè)進(jìn)程進(jìn)入臨界區(qū)代碼執(zhí)行,臨界區(qū)代碼允許睡眠;==
3、信號(hào)量本質(zhì)是==基于調(diào)度器的==,在UP和P下沒(méi)有區(qū)別;進(jìn)程獲取不到信號(hào)量將陷入休眠,并讓出CPU;
4、不支持進(jìn)程和中斷之間的同步
5、==進(jìn)程調(diào)度也是會(huì)消耗系統(tǒng)資源的,如果一個(gè)int型共享變量就需要使用信號(hào)量,將極大的浪費(fèi)系統(tǒng)資源==
6、信號(hào)量可以用于多個(gè)線程,用于資源的計(jì)數(shù)(有多種狀態(tài))
==信號(hào)量加鎖以及解鎖過(guò)程:==
sema_init(&sp->dead_sem, 0); /
初始化
/
down(&sema);
臨界區(qū)代碼
up(&sema);
==信號(hào)量定義:==
==信號(hào)量初始化:==
==dowm函數(shù)實(shí)現(xiàn)擾高:==
==up函數(shù)實(shí)現(xiàn):==
信號(hào)量一般可以用來(lái)標(biāo)記可用資源的個(gè)數(shù)。
舉2個(gè)生活中的例子:
==dowm函數(shù)實(shí)現(xiàn)原理解析:==
(1)down
判斷sem->count是否 > 0,大于0則說(shuō)明系統(tǒng)資源夠用,分配一個(gè)給該進(jìn)程,否則進(jìn)入__down(sem);
(2)__down
調(diào)用__down_common(sem, TASK_UNINTERRUPTIBLE, MAX_SCHEDULE_TIMEOUT);其中TASK_UNINTERRUPTIBLE=2代表進(jìn)入睡眠,且不可以打斷;MAX_SCHEDULE_TIMEOUT休眠最長(zhǎng)LONG_MAX時(shí)間;
(3)list_add_tail(&waiter.list, &sem->wait_list);
把當(dāng)前進(jìn)程加入到sem->wait_list中;
(3)先解鎖后加鎖;
進(jìn)入__down_common前已經(jīng)加鎖了,先把解鎖,調(diào)用schedule_timeout(timeout),當(dāng)waiter.up=1后跳出for循環(huán);退出函數(shù)之前再加鎖;
Linux內(nèi)核ARM構(gòu)架中原子變量的底層實(shí)現(xiàn)研究
rk3288 原子操作和原子位操作
原子變量適用于只共享一個(gè)int型變量;
1、原子操作是指不被打斷的操作,即它是最小的執(zhí)行單位。
2、最簡(jiǎn)單的原子操作就是一條條的匯編指令(不包括一些偽指令,偽指令會(huì)被匯編器解釋成多條匯編指令)
==常見(jiàn)函數(shù):==
==以atomic_inc為例介紹實(shí)現(xiàn)過(guò)程==
在Linux內(nèi)核文件archarmincludeaatomic.h中。 執(zhí)行atomic_read、atomic_set這些操作都只需要一條匯編指令,所以它們本身就是不可打斷的。 需要特別研究的是atomic_inc、atomic_dec這類讀出、修改、寫(xiě)回的函數(shù)。
所以atomic_add的原型是下面這個(gè)宏:
atomic_add等效于:
result(%0) tmp(%1) (v->counter)(%2) (&v->counter)(%3) i(%4)
注意:根據(jù)內(nèi)聯(lián)匯編的語(yǔ)法,result、tmp、&v->counter對(duì)應(yīng)的數(shù)據(jù)都放在了寄存器中操作。如果出現(xiàn)上下文切換,切換機(jī)制會(huì)做寄存器上下文保護(hù)。
(1)ldrex %0,
意思是將&v->counter指向的數(shù)據(jù)放入result中,并且(分別在Local monitor和Global monitor中)設(shè)置獨(dú)占標(biāo)志。
(2)add %0, %0, %4
result = result + i
(3)strex %1, %0,
意思是將result保存到&v->counter指向的內(nèi)存中,
此時(shí) Exclusive monitors會(huì)發(fā)揮作用,將保存是否成功的標(biāo)志放入tmp中。
(4) teq %1, #0
測(cè)試strex是否成功(tmp == 0 ??)
(5)bne 1b
如果發(fā)現(xiàn)strex失敗,從(1)再次執(zhí)行。
Spinlock 是內(nèi)核中提供的一種比較常見(jiàn)的鎖機(jī)制,==自旋鎖是“原地等待”的方式解決資源沖突的==,即,一個(gè)線程獲取了一個(gè)自旋鎖后,另外一個(gè)線程期望獲取該自旋鎖,獲取不到,只能夠原地“打轉(zhuǎn)”(忙等待)。由于自旋鎖的這個(gè)忙等待的特性,注定了它使用場(chǎng)景上的限制 —— 自旋鎖不應(yīng)該被長(zhǎng)時(shí)間的持有(消耗 CPU 資源),一般應(yīng)用在==中斷上下文==。
1、spinlock是一種死等機(jī)制
2、信號(hào)量可以允許多個(gè)執(zhí)行單元進(jìn)入,spinlock不行,一次只能允許一個(gè)執(zhí)行單元獲取鎖,并且進(jìn)入臨界區(qū),其他執(zhí)行單元都是在門(mén)口不斷的死等
3、由于不休眠,因此spinlock可以應(yīng)用在中斷上下文中;
4、由于spinlock死等的特性,因此臨界區(qū)執(zhí)行代碼盡可能的短;
==spinlock加鎖以及解鎖過(guò)程:==
spin_lock(&devices_lock);
臨界區(qū)代碼
spin_unlock(&devices_lock);
==spinlock初始化==
==進(jìn)程和進(jìn)程之間同步==
==本地軟中斷之間同步==
==本地硬中斷之間同步==
==本地硬中斷之間同步并且保存本地中斷狀態(tài)==
==嘗試獲取鎖==
==
arch_spinlock_t結(jié)構(gòu)體定義如下:
==
==
arch_spin_lock的實(shí)現(xiàn)如下:
==
lockval(%0) newval(%1) tmp(%2) &lock->slock(%3) 1 slock的值賦值給lockval;并且(分別在Local monitor和Global monitor中)設(shè)置獨(dú)占標(biāo)志。
(2)add %1, %0, %4
newval =lockval +(1slock指向的內(nèi)存中,
此時(shí) Exclusive monitors會(huì)發(fā)揮作用,將保存是否成功的標(biāo)志放入tmp中。
(4) teq %2, #0
測(cè)試strex是否成功
(5)bne 1b
如果發(fā)現(xiàn)strex失敗,從(1)再次執(zhí)行。
通過(guò)上面的分析,可知關(guān)鍵在于strex的操作是否成功的判斷上。而這個(gè)就歸功于ARM的Exclusive monitors和ldrex/strex指令的機(jī)制。
(6)while (lockval.tickets.next != lockval.tickets.owner)
如何lockval.tickets的next和owner是否相等。相同則跳出while循環(huán),否則在循環(huán)內(nèi)等待判斷;
*
(7)wfe()和p_mb() 最終調(diào)用#define barrier()
a
volatile
(“”: : :”memory”) *
阻止編譯器重排,保證編譯程序時(shí)在優(yōu)化屏障之前的指令不會(huì)在優(yōu)化屏障之后執(zhí)行。
==
arch_spin_unlock的實(shí)現(xiàn)如下:
==
退出鎖時(shí):tickets.owner++
==
出現(xiàn)死鎖的情況:
==
1、擁有自旋鎖的進(jìn)程A在內(nèi)核態(tài)阻塞了,內(nèi)核調(diào)度B進(jìn)程,碰巧B進(jìn)程也要獲得自旋鎖,此時(shí)B只能自旋轉(zhuǎn)。 而此時(shí)搶占已經(jīng)關(guān)閉,(單核)不會(huì)調(diào)度A進(jìn)程了,B永遠(yuǎn)自旋,產(chǎn)生死鎖。
2、進(jìn)程A擁有自旋鎖,中斷到來(lái),CPU執(zhí)行中斷函數(shù),中斷處理函數(shù),中斷處理函數(shù)需要獲得自旋鎖,訪問(wèn)共享資源,此時(shí)無(wú)法獲得鎖,只能自旋,產(chǎn)生死鎖。
==
如何避免死鎖:
==
1、如果中斷處理函數(shù)中也要獲得自旋鎖,那么驅(qū)動(dòng)程序需要在擁有自旋鎖時(shí)禁止中斷;
2、自旋鎖必須在可能的最短時(shí)間內(nèi)擁有
3、避免某個(gè)獲得鎖的函數(shù)調(diào)用其他同樣試圖獲取這個(gè)鎖的函數(shù),否則代碼就會(huì)死鎖;不論是信號(hào)量還是自旋鎖,都不允許鎖擁有者第二次獲得這個(gè)鎖,如果試圖這么做,系統(tǒng)將掛起;
4、鎖的順序規(guī)則(a) 按同樣的順序獲得鎖;b) 如果必須獲得一個(gè)局部鎖和一個(gè)屬于內(nèi)核更中心位置的鎖,則應(yīng)該首先獲取自己的局部鎖 ;c) 如果我們擁有信號(hào)量和自旋鎖的組合,則必須首先獲得信號(hào)量;在擁有自旋鎖時(shí)調(diào)用down(可導(dǎo)致休眠)是個(gè)嚴(yán)重的錯(cuò)誤的;)
==
rw(read/write)spinlock:
==
加鎖邏輯:
1、假設(shè)臨界區(qū)內(nèi)沒(méi)有任何的thread,這個(gè)時(shí)候任何的讀線程和寫(xiě)線程都可以鍵入
2、假設(shè)臨界區(qū)內(nèi)有一個(gè)讀線程,這時(shí)候信賴的read線程可以任意進(jìn)入,但是寫(xiě)線程不能進(jìn)入;
3、假設(shè)臨界區(qū)有一個(gè)寫(xiě)線程,這時(shí)候任何的讀、寫(xiě)線程都不可以進(jìn)入;
4、假設(shè)臨界區(qū)內(nèi)有一個(gè)或者多個(gè)讀線程,寫(xiě)線程不可以進(jìn)入臨界區(qū),但是寫(xiě)線程也無(wú)法阻止后續(xù)的讀線程繼續(xù)進(jìn)去,要等到臨界區(qū)所有的讀線程都結(jié)束了,才可以進(jìn)入,可見(jiàn):==rw(read/write)spinlock更加有利于讀線程;==
==
seqlock(順序鎖):
==
加鎖邏輯:
1、假設(shè)臨界區(qū)內(nèi)沒(méi)有任何的thread,這個(gè)時(shí)候任何的讀線程和寫(xiě)線程都可以鍵入
2、假設(shè)臨界區(qū)內(nèi)沒(méi)有寫(xiě)線程的情況下,read線程可以任意進(jìn)入;
3、假設(shè)臨界區(qū)有一個(gè)寫(xiě)線程,這時(shí)候任何的讀、寫(xiě)線程都不可以進(jìn)入;
4、假設(shè)臨界區(qū)內(nèi)只有read線程的情況下,寫(xiě)線程可以理解執(zhí)行,不會(huì)等待,可見(jiàn):==seqlock(順序鎖)更加有利于寫(xiě)線程;==
讀寫(xiě)速度
:
CPU > 一級(jí)緩存 > 二級(jí)緩存 > 內(nèi)存
,因此某一個(gè)CPU0的lock修改了,其他的CPU的lock就會(huì)失效;那么其他CPU就會(huì)依次去L1 L2和主存中讀取lock值,一旦其他CPU去讀取了主存,就存在系統(tǒng)性能降低的風(fēng)險(xiǎn);
mutex用于互斥操作。
互斥體只能用于一個(gè)線程,資源只有兩種狀態(tài)(占用或者空閑)
1、mutex的語(yǔ)義相對(duì)于信號(hào)量要簡(jiǎn)單輕便一些,在鎖爭(zhēng)用激烈的測(cè)試場(chǎng)景下,mutex比信號(hào)量執(zhí)行速度更快,可擴(kuò)展
性更好,
2、另外mutex數(shù)據(jù)結(jié)構(gòu)的定義比信號(hào)量小;、
3、同一時(shí)刻只有一個(gè)線程可以持有mutex
4、不允許遞歸地加鎖和解鎖
5、當(dāng)進(jìn)程持有mutex時(shí),進(jìn)程不可以退出。
? mutex必須使用官方API來(lái)初始化。
? mutex可以睡眠,所以不允許在中斷處理程序或者中斷下半部中使用,例如tasklet、定時(shí)器等
==常見(jiàn)操作:==
struct mutex mutex_1;
mutex_init(&mutex_1);
mutex_lock(&mutex_1)
臨界區(qū)代碼;
mutex_unlock(&mutex_1)
==常見(jiàn)函數(shù):==
=
成都網(wǎng)站營(yíng)銷推廣找創(chuàng)新互聯(lián),全國(guó)分站站群網(wǎng)站搭建更好做SEO營(yíng)銷。
創(chuàng)新互聯(lián)(www.cdcxhl.com)四川成都IDC基礎(chǔ)服務(wù)商,價(jià)格厚道。提供成都服務(wù)器托管租用、綿陽(yáng)服務(wù)器租用托管、重慶服務(wù)器托管租用、貴陽(yáng)服務(wù)器機(jī)房服務(wù)器托管租用。
本文標(biāo)題:探索Linux內(nèi)核:_read的作用及實(shí)現(xiàn)方式 (linux內(nèi)核_read)
網(wǎng)址分享:http://fisionsoft.com.cn/article/cosgsco.html


咨詢
建站咨詢
