择天记,玄幻小说改编的电视剧,懒人听书

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案

探索Linux內(nèi)核：_read的作用及實(shí)現(xiàn)方式 (linux內(nèi)核_read)

Linux操作系統(tǒng)是目前世界范圍內(nèi)廣泛應(yīng)用的一種開(kāi)源系統(tǒng)，其內(nèi)核作為操作系統(tǒng)的核心組成部分承載著操作系統(tǒng)的全部功能，使得操作系統(tǒng)得以運(yùn)行各種應(yīng)用程序。在Linux內(nèi)核中，_read是其中一個(gè)重要的函數(shù)，其在數(shù)據(jù)操作和文件讀寫(xiě)中扮演著非常重要的角色。本文將從_read函數(shù)的作用和實(shí)現(xiàn)方式兩個(gè)方面來(lái)探索Linux內(nèi)核。

一、_read函數(shù)的作用

_read是Linux文件系統(tǒng)中的一個(gè)函數(shù)，主要用于操作文件的讀取操作。當(dāng)我們?cè)谙到y(tǒng)中進(jìn)行讀操作時(shí)，_read函數(shù)將會(huì)被調(diào)用，該函數(shù)會(huì)檢查我們傳遞給它的參數(shù)，找到所期望的數(shù)據(jù)塊，然后將其從磁盤(pán)中讀出來(lái)，并將其存儲(chǔ)在用戶空間中以供使用。

具體來(lái)說(shuō)，當(dāng)用戶請(qǐng)求_read函數(shù)從文件中讀取數(shù)據(jù)時(shí)，_read就會(huì)進(jìn)入以下步驟：

1. _read函數(shù)會(huì)查找文件的索引節(jié)點(diǎn)，并獲取其相關(guān)屬性（例如文件大小和塊的大?。?/p>

2. 接著，_read函數(shù)會(huì)檢查用戶請(qǐng)求的數(shù)據(jù)塊是否為當(dāng)前的塊，并根據(jù)需要在磁盤(pán)中尋找該塊；

3. 如果找到了該塊，_read函數(shù)就會(huì)將其從磁盤(pán)中讀出來(lái)，并存儲(chǔ)在一個(gè)適當(dāng)?shù)膬?nèi)存緩存區(qū)中；

4. _read函數(shù)將數(shù)據(jù)塊復(fù)制到用戶的緩存區(qū)中，以便用戶可以對(duì)其進(jìn)行操作和使用。

因此，_read函數(shù)的作用就是完成了Linux文件系統(tǒng)中讀取數(shù)據(jù)的基本操作，為應(yīng)用程序提供了必要的數(shù)據(jù)。

二、_read函數(shù)的實(shí)現(xiàn)方式

_read函數(shù)的實(shí)現(xiàn)方式取決于所使用的文件系統(tǒng)和內(nèi)核版本。在Linux內(nèi)核的早期版本中，該函數(shù)的實(shí)現(xiàn)方式是通過(guò)調(diào)用底層的磁盤(pán)讀取函數(shù)來(lái)完成的。但是，在隨后的內(nèi)核版本中，這種方式被認(rèn)為是不夠有效的，因?yàn)樗鼘?duì)磁盤(pán)進(jìn)行了大量的讀取和寫(xiě)入，從而導(dǎo)致了性能下降。

為此，新的實(shí)現(xiàn)方式通過(guò)使用內(nèi)存緩存技術(shù)來(lái)提高性能。在這種情況下，_read函數(shù)會(huì)將數(shù)據(jù)塊存儲(chǔ)在內(nèi)存緩存中，以便在以后的讀操作中直接使用。這種實(shí)現(xiàn)方式的基本思路是：在文件系統(tǒng)被掛載時(shí)，內(nèi)存緩存會(huì)被預(yù)先填充，以便在以后的操作中提供快速訪問(wèn)。

三、

_read是Linux文件系統(tǒng)中非常重要的一個(gè)函數(shù)，它提供了文件數(shù)據(jù)的讀取功能。理解_read函數(shù)的作用和實(shí)現(xiàn)方式有助于我們更好地了解Linux內(nèi)核的工作原理和性能優(yōu)化方法。雖然_read函數(shù)的實(shí)現(xiàn)方式幾乎是每個(gè)內(nèi)核版本都不同，但是其本質(zhì)功能沒(méi)有改變，因此，對(duì)_read函數(shù)的研究可以使我們更好地理解Linux操作系統(tǒng)。

相關(guān)問(wèn)題拓展閱讀：

linux內(nèi)核同步問(wèn)題

linux內(nèi)核同步問(wèn)題

Linux內(nèi)核設(shè)計(jì)與實(shí)現(xiàn) 十、內(nèi)核同步方法

手把手教Linux驅(qū)動(dòng)5-自旋鎖、信號(hào)量、互斥體概述

基礎(chǔ)概念：

并發(fā)

：多個(gè)執(zhí)行單元同時(shí)進(jìn)行或多個(gè)執(zhí)行單元微觀串行執(zhí)行，宏謹(jǐn)拿觀并行執(zhí)行

競(jìng)態(tài)

：并發(fā)的執(zhí)行單元對(duì)共享資源（硬件資源和軟件上的全局變量）的訪問(wèn)而導(dǎo)致的竟態(tài)狀態(tài)。

臨界資源

：多個(gè)進(jìn)程訪問(wèn)的資源

臨界區(qū)

：多個(gè)進(jìn)程訪問(wèn)的代碼段

并發(fā)場(chǎng)合：

1、單CPU之間進(jìn)程間的并發(fā)

:時(shí)間片輪轉(zhuǎn)，調(diào)度進(jìn)程。 A進(jìn)程訪問(wèn)打印機(jī)，時(shí)間片用完，OS調(diào)度B進(jìn)程訪問(wèn)打印機(jī)。

2、單cpu上進(jìn)程和中斷之間并發(fā)

：CPU必須停止當(dāng)前進(jìn)程的執(zhí)行中斷;

3、多cpu之間

4、單CPU上中斷之間的并發(fā)

使用偏向：

==信號(hào)量用于進(jìn)程之間的同步，進(jìn)程在信號(hào)量保護(hù)的臨界區(qū)代碼里面是可以睡眠的（需要進(jìn)行進(jìn)程調(diào)度），這是與自旋鎖更大的區(qū)別。==

信號(hào)量又稱為信號(hào)燈，它是用來(lái)協(xié)調(diào)不同進(jìn)程間的數(shù)據(jù)對(duì)象的，而最主要的應(yīng)用是共享內(nèi)存方式的進(jìn)程間通信。本質(zhì)上，信號(hào)量是一個(gè)計(jì)數(shù)器，它用來(lái)記錄對(duì)某個(gè)資源（如共享內(nèi)存）的存取狀況。它負(fù)責(zé)協(xié)調(diào)各個(gè)進(jìn)程，以保證他們能夠正確、合理的使用公共資源。它和spin lock更大的不同之處就是：無(wú)法獲取信號(hào)量的進(jìn)程可以睡眠祥李搭，因此會(huì)導(dǎo)致系統(tǒng)調(diào)度。

1、==用于進(jìn)程與進(jìn)程之間的同步==

2、==允許多個(gè)進(jìn)程進(jìn)入臨界區(qū)代碼執(zhí)行，臨界區(qū)代碼允許睡眠；==

3、信號(hào)量本質(zhì)是==基于調(diào)度器的==，在UP和P下沒(méi)有區(qū)別；進(jìn)程獲取不到信號(hào)量將陷入休眠，并讓出CPU；

4、不支持進(jìn)程和中斷之間的同步

5、==進(jìn)程調(diào)度也是會(huì)消耗系統(tǒng)資源的，如果一個(gè)int型共享變量就需要使用信號(hào)量，將極大的浪費(fèi)系統(tǒng)資源==

6、信號(hào)量可以用于多個(gè)線程，用于資源的計(jì)數(shù)（有多種狀態(tài)）

==信號(hào)量加鎖以及解鎖過(guò)程：==

sema_init(&sp->dead_sem, 0); /

初始化

down(&sema);

臨界區(qū)代碼

up(&sema);

==信號(hào)量定義：==

==信號(hào)量初始化：==

==dowm函數(shù)實(shí)現(xiàn)擾高：==

==up函數(shù)實(shí)現(xiàn)：==

信號(hào)量一般可以用來(lái)標(biāo)記可用資源的個(gè)數(shù)。

舉2個(gè)生活中的例子：

==dowm函數(shù)實(shí)現(xiàn)原理解析：==

（1）down

判斷sem->count是否 > 0，大于0則說(shuō)明系統(tǒng)資源夠用，分配一個(gè)給該進(jìn)程，否則進(jìn)入__down(sem);

（2）__down

調(diào)用__down_common(sem, TASK_UNINTERRUPTIBLE, MAX_SCHEDULE_TIMEOUT);其中TASK_UNINTERRUPTIBLE=2代表進(jìn)入睡眠，且不可以打斷；MAX_SCHEDULE_TIMEOUT休眠最長(zhǎng)LONG_MAX時(shí)間；

（3）list_add_tail(&waiter.list, &sem->wait_list);

把當(dāng)前進(jìn)程加入到sem->wait_list中；

（3）先解鎖后加鎖;

進(jìn)入__down_common前已經(jīng)加鎖了，先把解鎖，調(diào)用schedule_timeout(timeout)，當(dāng)waiter.up=1后跳出for循環(huán)；退出函數(shù)之前再加鎖；

Linux內(nèi)核ARM構(gòu)架中原子變量的底層實(shí)現(xiàn)研究

rk3288 原子操作和原子位操作

原子變量適用于只共享一個(gè)int型變量；

1、原子操作是指不被打斷的操作，即它是最小的執(zhí)行單位。

2、最簡(jiǎn)單的原子操作就是一條條的匯編指令(不包括一些偽指令，偽指令會(huì)被匯編器解釋成多條匯編指令)

==常見(jiàn)函數(shù)：==

==以atomic_inc為例介紹實(shí)現(xiàn)過(guò)程==

在Linux內(nèi)核文件archarmincludeaatomic.h中。執(zhí)行atomic_read、atomic_set這些操作都只需要一條匯編指令，所以它們本身就是不可打斷的。需要特別研究的是atomic_inc、atomic_dec這類讀出、修改、寫(xiě)回的函數(shù)。

所以atomic_add的原型是下面這個(gè)宏：

atomic_add等效于：

result（%0） tmp（%1） (v->counter)（%2） (&v->counter)（%3） i（%4）

注意：根據(jù)內(nèi)聯(lián)匯編的語(yǔ)法，result、tmp、&v->counter對(duì)應(yīng)的數(shù)據(jù)都放在了寄存器中操作。如果出現(xiàn)上下文切換，切換機(jī)制會(huì)做寄存器上下文保護(hù)。

（1）ldrex %0,

意思是將&v->counter指向的數(shù)據(jù)放入result中，并且（分別在Local monitor和Global monitor中）設(shè)置獨(dú)占標(biāo)志。

（2）add %0, %0, %4

result = result + i

（3）strex %1, %0,

意思是將result保存到&v->counter指向的內(nèi)存中，

此時(shí) Exclusive monitors會(huì)發(fā)揮作用，將保存是否成功的標(biāo)志放入tmp中。

（4） teq %1, #0

測(cè)試strex是否成功（tmp == 0 ？？）

（5）bne 1b

如果發(fā)現(xiàn)strex失敗，從（1）再次執(zhí)行。

Spinlock 是內(nèi)核中提供的一種比較常見(jiàn)的鎖機(jī)制，==自旋鎖是“原地等待”的方式解決資源沖突的==，即，一個(gè)線程獲取了一個(gè)自旋鎖后，另外一個(gè)線程期望獲取該自旋鎖，獲取不到，只能夠原地“打轉(zhuǎn)”（忙等待）。由于自旋鎖的這個(gè)忙等待的特性，注定了它使用場(chǎng)景上的限制 —— 自旋鎖不應(yīng)該被長(zhǎng)時(shí)間的持有（消耗 CPU 資源），一般應(yīng)用在==中斷上下文==。

1、spinlock是一種死等機(jī)制

2、信號(hào)量可以允許多個(gè)執(zhí)行單元進(jìn)入，spinlock不行，一次只能允許一個(gè)執(zhí)行單元獲取鎖，并且進(jìn)入臨界區(qū)，其他執(zhí)行單元都是在門(mén)口不斷的死等

3、由于不休眠，因此spinlock可以應(yīng)用在中斷上下文中；

4、由于spinlock死等的特性，因此臨界區(qū)執(zhí)行代碼盡可能的短；

==spinlock加鎖以及解鎖過(guò)程：==

spin_lock(&devices_lock);

臨界區(qū)代碼

spin_unlock(&devices_lock);

==spinlock初始化==

==進(jìn)程和進(jìn)程之間同步==

==本地軟中斷之間同步==

==本地硬中斷之間同步==

==本地硬中斷之間同步并且保存本地中斷狀態(tài)==

==嘗試獲取鎖==

arch_spinlock_t結(jié)構(gòu)體定義如下：

arch_spin_lock的實(shí)現(xiàn)如下：

lockval（%0） newval（%1） tmp（%2） &lock->slock（%3） 1 slock的值賦值給lockval；并且（分別在Local monitor和Global monitor中）設(shè)置獨(dú)占標(biāo)志。

（2）add %1, %0, %4

newval =lockval +（1slock指向的內(nèi)存中，

此時(shí) Exclusive monitors會(huì)發(fā)揮作用，將保存是否成功的標(biāo)志放入tmp中。

（4） teq %2, #0

測(cè)試strex是否成功

（5）bne 1b

如果發(fā)現(xiàn)strex失敗，從（1）再次執(zhí)行。

通過(guò)上面的分析，可知關(guān)鍵在于strex的操作是否成功的判斷上。而這個(gè)就歸功于ARM的Exclusive monitors和ldrex/strex指令的機(jī)制。

（6）while (lockval.tickets.next != lockval.tickets.owner)

如何lockval.tickets的next和owner是否相等。相同則跳出while循環(huán)，否則在循環(huán)內(nèi)等待判斷；

（7）wfe()和p_mb() 最終調(diào)用#define barrier()

volatile

(“”: : :”memory”) *

阻止編譯器重排，保證編譯程序時(shí)在優(yōu)化屏障之前的指令不會(huì)在優(yōu)化屏障之后執(zhí)行。

arch_spin_unlock的實(shí)現(xiàn)如下：

退出鎖時(shí)：tickets.owner++

出現(xiàn)死鎖的情況：

1、擁有自旋鎖的進(jìn)程A在內(nèi)核態(tài)阻塞了，內(nèi)核調(diào)度B進(jìn)程，碰巧B進(jìn)程也要獲得自旋鎖，此時(shí)B只能自旋轉(zhuǎn)。而此時(shí)搶占已經(jīng)關(guān)閉，（單核）不會(huì)調(diào)度A進(jìn)程了，B永遠(yuǎn)自旋，產(chǎn)生死鎖。

2、進(jìn)程A擁有自旋鎖，中斷到來(lái)，CPU執(zhí)行中斷函數(shù)，中斷處理函數(shù)，中斷處理函數(shù)需要獲得自旋鎖，訪問(wèn)共享資源，此時(shí)無(wú)法獲得鎖，只能自旋，產(chǎn)生死鎖。

如何避免死鎖：

1、如果中斷處理函數(shù)中也要獲得自旋鎖，那么驅(qū)動(dòng)程序需要在擁有自旋鎖時(shí)禁止中斷；

2、自旋鎖必須在可能的最短時(shí)間內(nèi)擁有

3、避免某個(gè)獲得鎖的函數(shù)調(diào)用其他同樣試圖獲取這個(gè)鎖的函數(shù)，否則代碼就會(huì)死鎖；不論是信號(hào)量還是自旋鎖，都不允許鎖擁有者第二次獲得這個(gè)鎖，如果試圖這么做，系統(tǒng)將掛起；

4、鎖的順序規(guī)則（a) 按同樣的順序獲得鎖；b) 如果必須獲得一個(gè)局部鎖和一個(gè)屬于內(nèi)核更中心位置的鎖，則應(yīng)該首先獲取自己的局部鎖 ;c) 如果我們擁有信號(hào)量和自旋鎖的組合，則必須首先獲得信號(hào)量；在擁有自旋鎖時(shí)調(diào)用down(可導(dǎo)致休眠)是個(gè)嚴(yán)重的錯(cuò)誤的；）

rw（read/write）spinlock：

加鎖邏輯：

1、假設(shè)臨界區(qū)內(nèi)沒(méi)有任何的thread，這個(gè)時(shí)候任何的讀線程和寫(xiě)線程都可以鍵入

2、假設(shè)臨界區(qū)內(nèi)有一個(gè)讀線程，這時(shí)候信賴的read線程可以任意進(jìn)入，但是寫(xiě)線程不能進(jìn)入；

3、假設(shè)臨界區(qū)有一個(gè)寫(xiě)線程，這時(shí)候任何的讀、寫(xiě)線程都不可以進(jìn)入；

4、假設(shè)臨界區(qū)內(nèi)有一個(gè)或者多個(gè)讀線程，寫(xiě)線程不可以進(jìn)入臨界區(qū)，但是寫(xiě)線程也無(wú)法阻止后續(xù)的讀線程繼續(xù)進(jìn)去，要等到臨界區(qū)所有的讀線程都結(jié)束了，才可以進(jìn)入，可見(jiàn)：==rw（read/write）spinlock更加有利于讀線程；==

seqlock（順序鎖）：

加鎖邏輯：

1、假設(shè)臨界區(qū)內(nèi)沒(méi)有任何的thread，這個(gè)時(shí)候任何的讀線程和寫(xiě)線程都可以鍵入

2、假設(shè)臨界區(qū)內(nèi)沒(méi)有寫(xiě)線程的情況下，read線程可以任意進(jìn)入；

3、假設(shè)臨界區(qū)有一個(gè)寫(xiě)線程，這時(shí)候任何的讀、寫(xiě)線程都不可以進(jìn)入；

4、假設(shè)臨界區(qū)內(nèi)只有read線程的情況下，寫(xiě)線程可以理解執(zhí)行，不會(huì)等待，可見(jiàn)：==seqlock（順序鎖）更加有利于寫(xiě)線程；==

讀寫(xiě)速度

：

CPU > 一級(jí)緩存 > 二級(jí)緩存 > 內(nèi)存

，因此某一個(gè)CPU0的lock修改了，其他的CPU的lock就會(huì)失效；那么其他CPU就會(huì)依次去L1 L2和主存中讀取lock值，一旦其他CPU去讀取了主存，就存在系統(tǒng)性能降低的風(fēng)險(xiǎn)；

mutex用于互斥操作。

互斥體只能用于一個(gè)線程，資源只有兩種狀態(tài)（占用或者空閑）

1、mutex的語(yǔ)義相對(duì)于信號(hào)量要簡(jiǎn)單輕便一些，在鎖爭(zhēng)用激烈的測(cè)試場(chǎng)景下，mutex比信號(hào)量執(zhí)行速度更快，可擴(kuò)展

性更好，

2、另外mutex數(shù)據(jù)結(jié)構(gòu)的定義比信號(hào)量小;、

3、同一時(shí)刻只有一個(gè)線程可以持有mutex

4、不允許遞歸地加鎖和解鎖

5、當(dāng)進(jìn)程持有mutex時(shí)，進(jìn)程不可以退出。

? mutex必須使用官方API來(lái)初始化。

? mutex可以睡眠，所以不允許在中斷處理程序或者中斷下半部中使用，例如tasklet、定時(shí)器等

==常見(jiàn)操作：==

struct mutex mutex_1;

mutex_init(&mutex_1);

mutex_lock(&mutex_1)

臨界區(qū)代碼；

mutex_unlock(&mutex_1)

==常見(jiàn)函數(shù)：==

成都網(wǎng)站營(yíng)銷推廣找創(chuàng)新互聯(lián)，全國(guó)分站站群網(wǎng)站搭建更好做SEO營(yíng)銷。
創(chuàng)新互聯(lián)（www.cdcxhl.com）四川成都IDC基礎(chǔ)服務(wù)商，價(jià)格厚道。提供成都服務(wù)器托管租用、綿陽(yáng)服務(wù)器租用托管、重慶服務(wù)器托管租用、貴陽(yáng)服務(wù)器機(jī)房服務(wù)器托管租用。

本文標(biāo)題：探索Linux內(nèi)核：_read的作用及實(shí)現(xiàn)方式 (linux內(nèi)核_read)
網(wǎng)址分享：http://fisionsoft.com.cn/article/cosgsco.html

新聞中心

linux內(nèi)核同步問(wèn)題

其他資訊