新聞中心
在Linux系統(tǒng)中,為了增加內(nèi)存管理的效率,使用大頁(HugePage)是一個有效的方法。大頁是指一種比普通頁更大的內(nèi)存頁,通常是2MB或者1GB。對于一些需要大量內(nèi)存的應(yīng)用程序,比如大數(shù)據(jù)處理、虛擬化等,使用大頁可以大幅提升系統(tǒng)性能。下面介紹如何在Linux系統(tǒng)中設(shè)置大頁。

創(chuàng)新互聯(lián)公司是一家專注于成都網(wǎng)站建設(shè)、做網(wǎng)站與策劃設(shè)計,南票網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)10余年,網(wǎng)設(shè)計領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:南票等地區(qū)。南票做網(wǎng)站價格咨詢:18980820575
1. 檢查系統(tǒng)是否支持大頁
首先需要檢查系統(tǒng)是否支持大頁。執(zhí)行以下命令:
“`
$ grep -i huge /proc/meminfo
“`
如果輸出如下,則說明系統(tǒng)支持大頁:
“`
AnonHugePages: 0 kB
HugePages_Total: 128
HugePages_Free: 0
HugePages_Rsvd: 0
HugePages_Surp: 0
Hugepagesize: 2023 kB
“`
其中,HugePages_Total代表系統(tǒng)中可用的大頁數(shù)量。如果輸出為0,則說明系統(tǒng)不支持大頁或者未開啟大頁功能。
2. 修改內(nèi)核參數(shù)
要設(shè)置大頁,需要將內(nèi)核參數(shù)設(shè)置為允許大頁,執(zhí)行以下命令:
“`
$ sudo sysctl -w vm.nr_hugepages=128
“`
其中,128表示系統(tǒng)中可用的大頁數(shù)量。這個數(shù)量可以根據(jù)實際需要進行調(diào)整。
3. 分配大頁
設(shè)置好內(nèi)核參數(shù)后,需要分配大頁。執(zhí)行以下命令:
“`
$ sudo mkdir /mnt/huge
$ sudo mount -t hugetlbfs nodev /mnt/huge
“`
這會在系統(tǒng)中創(chuàng)建一個掛載點/mnt/huge,用于分配大頁。如果需要分配多個大頁,可以在/mnt/huge目錄下新建多個子目錄,每個子目錄對應(yīng)一個大頁。
4. 設(shè)置應(yīng)用程序
在應(yīng)用程序中使用大頁,需要對應(yīng)用程序進行設(shè)置。通常需要在應(yīng)用程序啟動時指定需要使用的大頁數(shù)量。具體方法可以參考應(yīng)用程序的文檔。
5. 驗證設(shè)置
設(shè)置完成后,可以執(zhí)行以下命令來驗證大頁是否生效:
“`
$ grep -i huge /proc/meminfo
“`
如果輸出如下,則說明大頁已經(jīng)生效:
“`
AnonHugePages: 0 kB
HugePages_Total: 128
HugePages_Free: 128
HugePages_Rsvd: 0
HugePages_Surp: 0
Hugepagesize: 2023 kB
“`
其中,HugePages_Free代表系統(tǒng)中未使用的大頁數(shù)量。
使用大頁可以顯著提升系統(tǒng)性能,特別是在需要大量內(nèi)存的應(yīng)用程序中。設(shè)置大頁需要先檢查系統(tǒng)是否支持,然后修改內(nèi)核參數(shù),分配大頁,最后對應(yīng)用程序進行設(shè)置。大頁設(shè)置完成后,可以通過檢查/proc/meminfo來驗證設(shè)置是否生效。
相關(guān)問題拓展閱讀:
- Linux 內(nèi)核的內(nèi)存管理 – 概念
Linux 內(nèi)核的內(nèi)存管理 – 概念
Concepts overview — The Linux Kernel documentation
Linux中的內(nèi)存管理是一個復(fù)雜的系統(tǒng),經(jīng)過多年的發(fā)展,它包含越來越多的功能,以支持從 MMU-less microcontrollers 到 supercomputers 的各種系統(tǒng)。
沒有MMU內(nèi)存管理的系統(tǒng)被稱為 nommu ,它值得寫一份專門的文檔進行描述。
盡管有些概念是相同的,這里我們假設(shè)MMU可用,CPU可以將虛擬地址轉(zhuǎn)換為物理地址。
計算機系統(tǒng)中的物理內(nèi)存是有限資源,即便支持內(nèi)存熱插拔,其可以安裝的內(nèi)存也有限的。物理內(nèi)存不一定必須是連續(xù)的;它可以作為一組不同的地址范圍被訪問。此外,不同的CPU架構(gòu),甚至同架構(gòu)的不同實現(xiàn)對如何定義這些地址范圍都是不同的。
這使得直接處理物理內(nèi)存異常復(fù)雜,為了避免這種復(fù)雜性,開發(fā)了
虛擬內(nèi)存 (virtual memory)
的概念。
虛擬內(nèi)存從應(yīng)用軟件中抽象出物理內(nèi)存的細節(jié),只允許在物理內(nèi)存棗神中保留需要的信息
(demand paging)
,并提供一種機制來保護和控制進程之間的數(shù)據(jù)共享。
通過虛擬內(nèi)存,每次內(nèi)存訪問都訪問一個
虛擬地址
。當CPU對從系統(tǒng)內(nèi)存讀?。ɑ?qū)懭耄┑闹噶钸M行解碼時,它將該指令中編碼的虛擬地址轉(zhuǎn)換為內(nèi)存控制器可以理解的物理地址。
物理內(nèi)存被切分為
頁幀 page frames
或
頁 pages
。頁的大小是基于架構(gòu)的。一些架構(gòu)允許從幾個支持的值中選擇頁大??;此選擇在內(nèi)核編譯時設(shè)置到內(nèi)核配置。
每個物理內(nèi)存頁都可以映射為一個或多個
虛擬頁(virtual pages)
。映射關(guān)系描述在
頁表(page tables)
中,頁表將程序使用的虛擬地址轉(zhuǎn)換為物理內(nèi)存地址。頁表以層次結(jié)構(gòu)組織。
更底層的表包含軟件使用的實際內(nèi)存頁的物理地址。較高層的表包含較低層表頁的物理地址。頂層表的指針駐留在寄存器中。
當CPU進行地址轉(zhuǎn)換的時候,它使用寄存器訪問頂級頁表。
虛擬地址的高位,用于頂級頁表的條目索引。然后,通過該條目訪問下級,下級的虛擬地址位又作為其下下級頁表的索引。虛擬地址的更低位定義實際頁內(nèi)的偏移量。
地址轉(zhuǎn)換需要多次內(nèi)存訪問,而內(nèi)存訪問相對于CPU速度來說比較慢。為了避免在地址轉(zhuǎn)換上花費寶貴的處理器周期,CPU維護著一個稱為
TLB
(Translation Lookaside Buffer)的用于地址轉(zhuǎn)換緩存(cache)。通常TLB是非常稀缺的資源,需要大內(nèi)存工作應(yīng)用程序會因為TLB未命中而影響性能。
很多現(xiàn)代CPU架構(gòu)允許頁表的高層直接映射到內(nèi)存頁。例如,x86架構(gòu),可以通過二級、三級頁表的條目映射2M甚至1G內(nèi)存頁。在Linux中,這些內(nèi)存頁稱為
大頁 (Huge)
。大頁的使用顯著降低了TLB的壓力,提高了TLB命中率,從而提高了系統(tǒng)的整體性能。
Linux提供兩種機制開啟使用大頁映射物理內(nèi)存。
之一個是
HugeTLB
文件系統(tǒng),即
hugetlbfs
。它是一個偽文件系統(tǒng),使用RAM作為其存儲。在此文件系統(tǒng)中創(chuàng)建的文件,數(shù)據(jù)駐留在內(nèi)存中,并使用大頁進行映射。
關(guān)于 HugeTLB Pages
另一個被稱為
THP (Transparent HugePages)
,后出的開啟大頁映射物理內(nèi)存的機制。
與
hugetlbfs
不同,hugetlbfs要求用戶和/或系統(tǒng)管理員配置系統(tǒng)內(nèi)存的哪些部分應(yīng)該并可以被大頁映射;THP透明地管理這些映射并獲取名稱。
關(guān)于 Transparent Hugepage Support
通常,硬件對不同物理內(nèi)存范圍的訪問方式有所限制。某些情況下,設(shè)備不能對所有可尋址內(nèi)存執(zhí)行DMA。在其他情況下,物理內(nèi)存的大小超過虛擬內(nèi)存的更大可尋址大小,需要采取改巖大特殊措施來訪問部分內(nèi)存。還有些情況,物理內(nèi)存的尺寸超過了虛擬內(nèi)存的更大可尋址尺寸,需要采取特殊措施來訪問部分內(nèi)存。
Linux根據(jù)內(nèi)存頁的使用情況,將其組合為多個
zones
。比如, ZONE_DMA 包含設(shè)備用于DMA的內(nèi)存, ZONE_HIGHMEM 包含未永久映射到內(nèi)核核豎地址空間的內(nèi)存, ZONE_NORMAL 包含正常尋址內(nèi)存頁。
內(nèi)存zones的實際層次架構(gòu)取決于硬件,因為并非所有架構(gòu)都定義了所有的zones,不同平臺對DMA的要求也不同。
多處理器機器很多基于
NUMA
(Non-Uniform Memory Access system – 非統(tǒng)一內(nèi)存訪問系統(tǒng) )架構(gòu)。 在這樣的系統(tǒng)中,根據(jù)與處理器的“距離”,內(nèi)存被安排成具有不同訪問延遲的
banks
。每個
bank
被稱為一個
node
,Linux為每個
node
構(gòu)造一個獨立的內(nèi)存管理子系統(tǒng)。
Node
有自己的zones、free&used頁面列表,以及各種統(tǒng)計計數(shù)器。
What is NUMA?
NUMA Memory Policy
物理內(nèi)存易失,將數(shù)據(jù)放入內(nèi)存的常見情況是讀取文件。讀取文件時,數(shù)據(jù)會放入
頁面緩存(page cache)
,可以在再次讀取時避免耗時的磁盤訪問。同樣,寫文件時,數(shù)據(jù)也會被放入
頁面緩存
,并最終進入存儲設(shè)備。被寫入的頁被標記為
臟頁(dirty page)
,當Linux決定將其重用時,它會將更新的數(shù)據(jù)同步到設(shè)備上的文件。
匿名內(nèi)存 anonymous memory
或
匿名映射 anonymous mappings
表示沒有后置文件系統(tǒng)的內(nèi)存。這些映射是為程序的stack和heap隱式創(chuàng)建的,或調(diào)用mmap(2)顯式創(chuàng)建的。通常,匿名映射只定義允許程序訪問的虛擬內(nèi)存區(qū)域。讀,會創(chuàng)建一個頁表條目,該條目引用一個填充有零的特殊物理頁。寫,則分配一個常規(guī)物理頁來保存寫入數(shù)據(jù)。該頁將被標記為臟頁,如果內(nèi)核決定重用該頁,則臟頁將被交換出去
swapped out
。
縱貫整個系統(tǒng)生命周期,物理頁可用于存儲不同類型的數(shù)據(jù)。它可以是內(nèi)核內(nèi)部數(shù)據(jù)結(jié)構(gòu)、設(shè)備驅(qū)動DMA緩沖區(qū)、讀取自文件系統(tǒng)的數(shù)據(jù)、用戶空間進程分配的內(nèi)存等。
根據(jù)內(nèi)存頁使用情況,Linux內(nèi)存管理會區(qū)別處理??梢噪S時釋放的頁面稱為
可回收(reclaimable)
頁面,因為它們把數(shù)據(jù)緩存到了其他地方(比如,硬盤),或者被swap out到硬盤上。
可回收頁最值得注意的是
頁面緩存
和
匿名頁面
。
在大多數(shù)情況下,存放內(nèi)部內(nèi)核數(shù)據(jù)的頁,和用作DMA緩沖區(qū)的頁無法重用,它們將保持現(xiàn)狀直到用戶釋放。這樣的被稱為
不可回收頁(unreclaimable)
。
然而,在特定情況下,即便是內(nèi)核數(shù)據(jù)結(jié)構(gòu)占用的頁面也會被回收。
例如,文件系統(tǒng)元數(shù)據(jù)的緩存(in-memory)可以從存儲設(shè)備中重新讀取,因此,當系統(tǒng)存在內(nèi)存壓力時,可以從主內(nèi)存中丟棄它們。
釋放可回收物理內(nèi)存頁并重新調(diào)整其用途的過程稱為
(surprise!) reclaim
。
Linux支持異步或同步回收頁,取決于系統(tǒng)的狀態(tài)。
當系統(tǒng)負載不高時,大部分內(nèi)存是空閑的,可以立即從空閑頁得到分配。
當系統(tǒng)負載提升后,空閑頁減少,當達到某個閾值(
low watermark
)時,內(nèi)存分配請求將喚醒
kswapd
守護進程。它將以異步的方式掃描內(nèi)存頁。如果內(nèi)存頁中的數(shù)據(jù)在其他地方也有,則釋放這些內(nèi)存頁;或者退出內(nèi)存到后置存儲設(shè)備(關(guān)聯(lián)
臟頁
)。
隨著內(nèi)存使用量進一步增加,并達到另一個閾值-
min watermark
-將觸發(fā)回收。這種情況下,分配將暫停,直到回收到足夠的內(nèi)存頁。
當系統(tǒng)運行時,任務(wù)分配并釋放內(nèi)存,內(nèi)存變得碎片化。
雖然使用虛擬內(nèi)存可以將分散的物理頁表示為虛擬連續(xù)范圍,但有時需要分配大的連續(xù)的物理內(nèi)存。這種需求可能會提升。例如,當設(shè)備驅(qū)動需要一個大的DMA緩沖區(qū)時,或當THP分配一個大頁時。
內(nèi)存地址壓縮(compaction )
解決了碎片問題。
該機制將占用的頁從內(nèi)存zone的下部移動到上部的空閑頁。壓縮掃描完成后,zone開始處的空閑頁就并在一起了,分配較大的連續(xù)物理內(nèi)存就可行了。
與
reclaim
類似,
compaction
可以在
kcompactd守護進程中異步進行,也可以作為內(nèi)存分配請求的結(jié)果同步進行。
在存在負載的機器上,內(nèi)存可能會耗盡,內(nèi)核無法回收到足夠的內(nèi)存以繼續(xù)運行。
為了保障系統(tǒng)的其余部分,引入了
OOM killer
。
OOM killer
選擇犧牲一個任務(wù)來保障系統(tǒng)的總體健康。選定的任務(wù)被killed,以期望在它退出后釋放足夠的內(nèi)存以繼續(xù)正常的操作。
關(guān)于linux系統(tǒng)大頁設(shè)置的介紹到此就結(jié)束了,不知道你從中找到你需要的信息了嗎 ?如果你還想了解更多這方面的信息,記得收藏關(guān)注本站。
成都網(wǎng)站推廣找創(chuàng)新互聯(lián),老牌網(wǎng)站營銷公司
成都網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián)(www.cdcxhl.com)專注高端網(wǎng)站建設(shè),網(wǎng)頁設(shè)計制作,網(wǎng)站維護,網(wǎng)絡(luò)營銷,SEO優(yōu)化推廣,快速提升企業(yè)網(wǎng)站排名等一站式服務(wù)。IDC基礎(chǔ)服務(wù):云服務(wù)器、虛擬主機、網(wǎng)站系統(tǒng)開發(fā)經(jīng)驗、服務(wù)器租用、服務(wù)器托管提供四川、成都、綿陽、雅安、重慶、貴州、昆明、鄭州、湖北十堰機房互聯(lián)網(wǎng)數(shù)據(jù)中心業(yè)務(wù)。
分享題目:如何在Linux系統(tǒng)中設(shè)置大頁(HugePage)? (linux系統(tǒng)大頁設(shè)置)
瀏覽路徑:http://fisionsoft.com.cn/article/cooojoo.html


咨詢
建站咨詢
