新聞中心
理解Linux系統(tǒng)負(fù)荷(cpu load)
一、查看系統(tǒng)負(fù)荷
創(chuàng)新互聯(lián)是專業(yè)的鶴山網(wǎng)站建設(shè)公司,鶴山接單;提供成都網(wǎng)站制作、成都網(wǎng)站設(shè)計(jì)、外貿(mào)營銷網(wǎng)站建設(shè),網(wǎng)頁設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行鶴山網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來合作!
在Linux系統(tǒng)中,我們一般使用 uptime命令 查看( w命令 和 top命令 也行)。(另外,它們在蘋果公司的Mac電腦上也適用。)
你在終端窗口鍵入uptime,系統(tǒng)會返回一行信息。
這行信息的后半部分,顯示 "load average", 它的意思是 "系統(tǒng)的平均負(fù)荷" ,里面有三個數(shù)字,我們可以從中判斷系統(tǒng)負(fù)荷是大還是小。它們的意思 分別是1分鐘、5分鐘、15分鐘內(nèi)系統(tǒng)的平均負(fù)荷。當(dāng)CPU完全空閑的時候,平均負(fù)荷為0;當(dāng)CPU工作量飽和的時候,平均負(fù)荷為1。 那么很顯然, "load average"的值越低,比如等于0.2或0.3,就說明電腦的工作量越小,系統(tǒng)負(fù)荷比較輕。
二. 判斷系統(tǒng)負(fù)荷是否過重,必須理解load average的真正含義
首先,假設(shè)最簡單的情況,你的電腦只有一個CPU,所有的運(yùn)算都必須由這個CPU來完成
如果CPU每分鐘最多處理100個進(jìn)程,那么系統(tǒng)負(fù)荷0.2,意味著CPU在這1分鐘里只處理20個進(jìn)程;系統(tǒng)負(fù)荷1.0,意味著CPU在這1分鐘里正好處理100個進(jìn)程;系統(tǒng)負(fù)荷1.7,意味著除了CPU正在處理的100個進(jìn)程以外,還有70個進(jìn)程正排隊(duì)等著CPU處理。
為了電腦順暢運(yùn)行,系統(tǒng)負(fù)荷最好不要超過1.0,這樣就沒有進(jìn)程需要等待了,所有進(jìn)程都能第一時間得到處理。很顯然,1.0是一個關(guān)鍵值,超過這個值,系統(tǒng)就不在最佳狀態(tài)了,你要動手干預(yù)了。
三、系統(tǒng)負(fù)荷的經(jīng)驗(yàn)法則
1.0是系統(tǒng)負(fù)荷的理想值嗎?
不一定,系統(tǒng)管理員往往會留一點(diǎn)余地,當(dāng)這個值達(dá)到0.7,就應(yīng)當(dāng)引起注意了。經(jīng)驗(yàn)法則是這樣的:
當(dāng)系統(tǒng)負(fù)荷持續(xù)大于0.7,你必須開始調(diào)查了,問題出在哪里,防止情況惡化。
當(dāng)系統(tǒng)負(fù)荷持續(xù)大于1.0,你必須動手尋找解決辦法,把這個值降下來。
當(dāng)系統(tǒng)負(fù)荷達(dá)到5.0,就表明你的系統(tǒng)有很嚴(yán)重的問題,長時間沒有響應(yīng),或者接近死機(jī)了。你不應(yīng)該讓系統(tǒng)達(dá)到這個值。
四、多處理器
如果你的電腦裝了2個CPU,會發(fā)生什么情況呢?
2個CPU,意味著電腦的處理能力翻了一倍,能夠同時處理的進(jìn)程數(shù)量也翻了一倍。
2個CPU表明系統(tǒng)負(fù)荷可以達(dá)到2.0,此時每個CPU都達(dá)到100%的工作量。推廣開來, n個CPU的電腦,可接受的系統(tǒng)負(fù)荷最大為n.0 。
五、多核處理器
芯片廠商往往在 一個CPU內(nèi)部,包含多個CPU核心 ,這被稱為 多核CPU 。
在系統(tǒng)負(fù)荷方面,多核CPU與多CPU效果類似,所以考慮系統(tǒng)負(fù)荷的時候,必須 考慮這臺電腦有幾個CPU、每個CPU有幾個核心 。然后, 把系統(tǒng)負(fù)荷除以總的核心數(shù),只要每個核心的負(fù)荷不超過1.0 ,就表明電腦正常運(yùn)行。
怎么知道電腦有多少個CPU核心呢?
"cat /proc/cpuinfo"命令,可以查看CPU信息。"grep -c 'model name' /proc/cpuinfo"命令,直接返回CPU的總核心數(shù)。
六、最佳觀察時長
最后一個問題,"load average"一共返回三個平均值----1分鐘系統(tǒng)負(fù)荷、5分鐘系統(tǒng)負(fù)荷,15分鐘系統(tǒng)負(fù)荷,----應(yīng)該參考哪個值?
如果只有1分鐘的系統(tǒng)負(fù)荷大于1.0,其他兩個時間段都小于1.0,這表明只是暫時現(xiàn)象,問題不大。
如果15分鐘內(nèi),平均系統(tǒng)負(fù)荷大于1.0(調(diào)整CPU核心數(shù)之后),表明問題持續(xù)存在,不是暫時現(xiàn)象。所以,你應(yīng)該主要觀察"15分鐘系統(tǒng)負(fù)荷",將它作為電腦正常運(yùn)行的指標(biāo)。
LINUX下查看CPU負(fù)載的所有命令
$ vmstat
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 4 329796 26040 4528 3379824 1 1 50 160 36 17 2 10 85 3 0
procs
r 列表示運(yùn)行和等待cpu時間片的進(jìn)程數(shù),如果長期大于1,說明cpu不足,需要增加cpu。
b 列表示在等待資源的進(jìn)程數(shù),比如正在等待I/O、或者內(nèi)存交換等。
cpu 表示cpu的使用狀態(tài)
us 列顯示了用戶方式下所花費(fèi) CPU 時間的百分比。us的值比較高時,說明用戶進(jìn)程消耗的cpu時間多,但是如果長期大于50%,需要考慮優(yōu)化用戶的程序。
sy 列顯示了內(nèi)核進(jìn)程所花費(fèi)的cpu時間的百分比。這里us + sy的參考值為80%,如果us+sy 大于 80%說明可能存在CPU不足。
wa 列顯示了IO等待所占用的CPU時間的百分比。這里wa的參考值為30%,如果wa超過30%,說明IO等待嚴(yán)重,這可能是磁盤大量隨機(jī)訪問造成的,也可能磁盤或者磁盤訪問控制器的帶寬瓶頸造成的(主要是塊操作)。
id 列顯示了cpu處在空閑狀態(tài)的時間百分比
system 顯示采集間隔內(nèi)發(fā)生的中斷數(shù)
in 列表示在某一時間間隔中觀測到的每秒設(shè)備中斷數(shù)。
cs列表示每秒產(chǎn)生的上下文切換次數(shù),如當(dāng) cs 比磁盤 I/O 和網(wǎng)絡(luò)信息包速率高得多,都應(yīng)進(jìn)行進(jìn)一步調(diào)查。
memory
swpd 切換到內(nèi)存交換區(qū)的內(nèi)存數(shù)量(k表示)。如果swpd的值不為0,或者比較大,比如超過了100m,只要si、so的值長期為0,系統(tǒng)性能還是正常
free 當(dāng)前的空閑頁面列表中內(nèi)存數(shù)量(k表示)
buff 作為buffer cache的內(nèi)存數(shù)量,一般對塊設(shè)備的讀寫才需要緩沖。
cache: 作為page cache的內(nèi)存數(shù)量,一般作為文件系統(tǒng)的cache,如果cache較大,說明用到cache的文件較多,如果此時IO中bi比較小,說明文件系統(tǒng)效率比較好。
swap
si 由內(nèi)存進(jìn)入內(nèi)存交換區(qū)數(shù)量。
so由內(nèi)存交換區(qū)進(jìn)入內(nèi)存數(shù)量。
IO
bi 從塊設(shè)備讀入數(shù)據(jù)的總量(讀磁盤)(每秒kb)。
bo 塊設(shè)備寫入數(shù)據(jù)的總量(寫磁盤)(每秒kb)
這里我們設(shè)置的bi+bo參考值為1000,如果超過1000,而且wa值較大應(yīng)該考慮均衡磁盤負(fù)載,可以結(jié)合iostat輸出來分析。
Linux系統(tǒng)下怎么查看應(yīng)用CPU、內(nèi)存、負(fù)載?
Linux 系統(tǒng)中―/proc‖是個偽文件目錄,不占用系統(tǒng)空間,及時的反應(yīng)出內(nèi)存現(xiàn)在使用的進(jìn)程情況......其中許多文件都保存系統(tǒng)運(yùn)行狀態(tài)和相關(guān)信息對于―/proc‖中文件可使用文件查看命令瀏覽其內(nèi)容,文件中包含系統(tǒng)特定信息:
cpuinfo 主機(jī)CPU 信息
filesystems 文件系統(tǒng)信息
meninfo 主機(jī)內(nèi)存信息
version Linux 內(nèi)存版本信息
diskstatus 磁盤負(fù)載情況
另外top 命令可以動態(tài)的顯示當(dāng)前系統(tǒng)進(jìn)程用戶的使用情況,而且是動態(tài)的顯示出來,尤其是在該命令顯示出來的對上方對系統(tǒng)的情況進(jìn)行匯總.
free 命令呢可以查看真實(shí)使用的內(nèi)存 一般用free -m
使用lsof 、ps -aux 可以查看詳細(xì)的每個進(jìn)程的使用狀況
dmesg 也是常用來查看系統(tǒng)性能的命令
如何用九條命令在一分鐘內(nèi)檢查Linux服務(wù)器性能
一、uptime命令
這個命令可以快速查看機(jī)器的負(fù)載情況。在Linux系統(tǒng)中,這些數(shù)據(jù)表示等待CPU資源的進(jìn)程和阻塞在不可中斷IO進(jìn)程(進(jìn)程狀態(tài)為D)的數(shù)量。這些數(shù)據(jù)可以讓我們對系統(tǒng)資源使用有一個宏觀的了解。
命令的輸出分別表示1分鐘、5分鐘、15分鐘的平均負(fù)載情況。通過這三個數(shù)據(jù),可以了解服務(wù)器負(fù)載是在趨于緊張還是趨于緩解。如果1分鐘平均負(fù)載很高,而15分鐘平均負(fù)載很低,說明服務(wù)器正在命令高負(fù)載情況,需要進(jìn)一步排查CPU資源都消耗在了哪里。反之,如果15分鐘平均負(fù)載很高,1分鐘平均負(fù)載較低,則有可能是CPU資源緊張時刻已經(jīng)過去。
上面例子中的輸出,可以看見最近1分鐘的平均負(fù)載非常高,且遠(yuǎn)高于最近15分鐘負(fù)載,因此我們需要繼續(xù)排查當(dāng)前系統(tǒng)中有什么進(jìn)程消耗了大量的資源??梢酝ㄟ^下文將會介紹的vmstat、mpstat等命令進(jìn)一步排查。
二、dmesg命令
該命令會輸出系統(tǒng)日志的最后10行。示例中的輸出,可以看見一次內(nèi)核的oom kill和一次TCP丟包。這些日志可以幫助排查性能問題。千萬不要忘了這一步。
三、vmstat命令
vmstat(8) 命令,每行會輸出一些系統(tǒng)核心指標(biāo),這些指標(biāo)可以讓我們更詳細(xì)的了解系統(tǒng)狀態(tài)。后面跟的參數(shù)1,表示每秒輸出一次統(tǒng)計(jì)信息,表頭提示了每一列的含義,這幾介紹一些和性能調(diào)優(yōu)相關(guān)的列:
r:等待在CPU資源的進(jìn)程數(shù)。這個數(shù)據(jù)比平均負(fù)載更加能夠體現(xiàn)CPU負(fù)載情況,數(shù)據(jù)中不包含等待IO的進(jìn)程。如果這個數(shù)值大于機(jī)器CPU核數(shù),那么機(jī)器的CPU資源已經(jīng)飽和。
free:系統(tǒng)可用內(nèi)存數(shù)(以千字節(jié)為單位),如果剩余內(nèi)存不足,也會導(dǎo)致系統(tǒng)性能問題。下文介紹到的free命令,可以更詳細(xì)的了解系統(tǒng)內(nèi)存的使用情況。
si,so:交換區(qū)寫入和讀取的數(shù)量。如果這個數(shù)據(jù)不為0,說明系統(tǒng)已經(jīng)在使用交換區(qū)(swap),機(jī)器物理內(nèi)存已經(jīng)不足。
us, sy, id, wa, st:這些都代表了CPU時間的消耗,它們分別表示用戶時間(user)、系統(tǒng)(內(nèi)核)時間(sys)、空閑時間(idle)、IO等待時間(wait)和被偷走的時間(stolen,一般被其他虛擬機(jī)消耗)。
上述這些CPU時間,可以讓我們很快了解CPU是否出于繁忙狀態(tài)。一般情況下,如果用戶時間和系統(tǒng)時間相加非常大,CPU出于忙于執(zhí)行指令。如果IO等待時間很長,那么系統(tǒng)的瓶頸可能在磁盤IO。
示例命令的輸出可以看見,大量CPU時間消耗在用戶態(tài),也就是用戶應(yīng)用程序消耗了CPU時間。這不一定是性能問題,需要結(jié)合r隊(duì)列,一起分析。
四、mpstat命令
該命令可以顯示每個CPU的占用情況,如果有一個CPU占用率特別高,那么有可能是一個單線程應(yīng)用程序引起的。
五、pidstat命令
pidstat命令輸出進(jìn)程的CPU占用率,該命令會持續(xù)輸出,并且不會覆蓋之前的數(shù)據(jù),可以方便觀察系統(tǒng)動態(tài)。如上的輸出,可以看見兩個JAVA進(jìn)程占用了將近1600%的CPU時間,既消耗了大約16個CPU核心的運(yùn)算資源。
六、iostat命令
r/s, w/s, rkB/s, wkB/s:分別表示每秒讀寫次數(shù)和每秒讀寫數(shù)據(jù)量(千字節(jié))。讀寫量過大,可能會引起性能問題。
await:IO操作的平均等待時間,單位是毫秒。這是應(yīng)用程序在和磁盤交互時,需要消耗的時間,包括IO等待和實(shí)際操作的耗時。如果這個數(shù)值過大,可能是硬件設(shè)備遇到了瓶頸或者出現(xiàn)故障。
avgqu-sz:向設(shè)備發(fā)出的請求平均數(shù)量。如果這個數(shù)值大于1,可能是硬件設(shè)備已經(jīng)飽和(部分前端硬件設(shè)備支持并行寫入)。
%util:設(shè)備利用率。這個數(shù)值表示設(shè)備的繁忙程度,經(jīng)驗(yàn)值是如果超過60,可能會影響IO性能(可以參照IO操作平均等待時間)。如果到達(dá)100%,說明硬件設(shè)備已經(jīng)飽和。
如果顯示的是邏輯設(shè)備的數(shù)據(jù),那么設(shè)備利用率不代表后端實(shí)際的硬件設(shè)備已經(jīng)飽和。值得注意的是,即使IO性能不理想,也不一定意味這應(yīng)用程序性能會不好,可以利用諸如預(yù)讀取、寫緩存等策略提升應(yīng)用性能。
七、free命令
free命令可以查看系統(tǒng)內(nèi)存的使用情況,-m參數(shù)表示按照兆字節(jié)展示。最后兩列分別表示用于IO緩存的內(nèi)存數(shù),和用于文件系統(tǒng)頁緩存的內(nèi)存數(shù)。需要注意的是,第二行-/+ buffers/cache,看上去緩存占用了大量內(nèi)存空間。
這是Linux系統(tǒng)的內(nèi)存使用策略,盡可能的利用內(nèi)存,如果應(yīng)用程序需要內(nèi)存,這部分內(nèi)存會立即被回收并分配給應(yīng)用程序。因此,這部分內(nèi)存一般也被當(dāng)成是可用內(nèi)存。
如果可用內(nèi)存非常少,系統(tǒng)可能會動用交換區(qū)(如果配置了的話),這樣會增加IO開銷(可以在iostat命令中提現(xiàn)),降低系統(tǒng)性能。
八、sar命令
sar命令在這里可以查看網(wǎng)絡(luò)設(shè)備的吞吐率。在排查性能問題時,可以通過網(wǎng)絡(luò)設(shè)備的吞吐量,判斷網(wǎng)絡(luò)設(shè)備是否已經(jīng)飽和。如示例輸出中,eth0網(wǎng)卡設(shè)備,吞吐率大概在22 Mbytes/s,既176 Mbits/sec,沒有達(dá)到1Gbit/sec的硬件上限。
sar命令在這里用于查看TCP連接狀態(tài),其中包括:
active/s:每秒本地發(fā)起的TCP連接數(shù),既通過connect調(diào)用創(chuàng)建的TCP連接;
passive/s:每秒遠(yuǎn)程發(fā)起的TCP連接數(shù),即通過accept調(diào)用創(chuàng)建的TCP連接;
retrans/s:每秒TCP重傳數(shù)量;
TCP連接數(shù)可以用來判斷性能問題是否由于建立了過多的連接,進(jìn)一步可以判斷是主動發(fā)起的連接,還是被動接受的連接。TCP重傳可能是因?yàn)榫W(wǎng)絡(luò)環(huán)境惡劣,或者服務(wù)器壓
九、top命令
top命令包含了前面好幾個命令的檢查的內(nèi)容。比如系統(tǒng)負(fù)載情況(uptime)、系統(tǒng)內(nèi)存使用情況(free)、系統(tǒng)CPU使用情況(vmstat)等。因此通過這個命令,可以相對全面的查看系統(tǒng)負(fù)載的來源。同時,top命令支持排序,可以按照不同的列排序,方便查找出諸如內(nèi)存占用最多的進(jìn)程、CPU占用率最高的進(jìn)程等。
但是,top命令相對于前面一些命令,輸出是一個瞬間值,如果不持續(xù)盯著,可能會錯過一些線索。這時可能需要暫停top命令刷新,來記錄和比對數(shù)據(jù)。
新聞名稱:cpu負(fù)載命令linux 什么叫cpu負(fù)載
瀏覽路徑:http://fisionsoft.com.cn/article/higepd.html