新聞中心
R語言可視化通路富集網(wǎng)絡(luò)圖
我們輸入的數(shù)據(jù)包含 gene ID 和 vector(單樣本)部分,這里的 gene ID 是一個通用概念,可以是基因、轉(zhuǎn)錄本、酶或蛋白質(zhì)。這里的 vector 可以是樣本的表達量、倍數(shù)變化, p-value, 組蛋白修飾數(shù)據(jù)等可測量的屬性。下面我們以一個 RNA-seq 差異分析后的數(shù)據(jù)為例,來學(xué)習(xí) pathview 的用法。
成都創(chuàng)新互聯(lián)是專業(yè)的宿州網(wǎng)站建設(shè)公司,宿州接單;提供網(wǎng)站制作、網(wǎng)站設(shè)計,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進行宿州網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!
在 KEGG PATHWAY Database 查詢,例如查詢小鼠的"Cell Cycle"這條通路:
得到通路 ID 為"04110",物種為"mmu"
我們通過指定 gene.data 和 pathway.id 來觀察我們數(shù)據(jù)里的基因在信號通路“Pathways in cancer”上的表達變化:
相比于原始的 KEGG 圖,我們可以使用 graphviz 產(chǎn)生一個新的布局,并且輸出 PDF 格式的文件:
以下是輸出結(jié)果圖
如果我們想要運行的更快一點,并且不介意輸出圖片的大小,我們可以分圖層,用 same.layer = F 將節(jié)點顏色和標(biāo)簽添加到另一個圖層中,并且原來的 KEGG 基因標(biāo)簽會變成官方的 gene symbols :
在此基礎(chǔ)上,修改 kegg.native = FALSE ,我們就可以得到一個主圖與圖例分成兩個頁面的 PDF 文件
在原始的 KEGG 視圖中,一個基因節(jié)點可能代表具有相似或者冗余功能的基因/蛋白質(zhì),我們可以將這種包含多個基因的節(jié)點拆分成獨立的銷攜節(jié)點,這樣可以更好的坦迅從基因?qū)用嫣澬欧皇枪?jié)點層面來查看數(shù)據(jù)。同時也可以通過匯總基因數(shù)據(jù)來可視化節(jié)點數(shù)據(jù):
為了畫面有更好的清晰度和可讀性,默認(rèn)不分裂節(jié)點,也不單獨標(biāo)記每個成員基因。
代謝途徑中,除了基因節(jié)點還有化合物節(jié)點,我們可以嘗試?yán)么x途徑( Propanoate metabolism)整合基因數(shù)據(jù)和化合物數(shù)據(jù)。這里的化合物數(shù)據(jù)包括代謝物、藥物,對它們的測量和它們的屬性。在這里我們?nèi)匀皇褂弥?RNA-seq 差異分析的數(shù)據(jù)作為 gene data,然后,我們生成模擬化合物或代謝組數(shù)據(jù),并加載適當(dāng)?shù)幕衔?ID 類型以進行演示:
結(jié)果如下
pathview 可以集成并將多個樣本或狀態(tài)繪制成一個圖,我們可以使用多個重復(fù)樣本模擬化合物數(shù)據(jù):
結(jié)果如下,可以看到基因節(jié)點和化合物節(jié)點被分成多份,對應(yīng)不同的樣本:
我們可以根據(jù)將化合物數(shù)據(jù)分為絕對值大于 5 和小于 5 兩類,構(gòu)成一組離散型數(shù)據(jù):
結(jié)果如下:
Pathview 包中的主函數(shù)是 pathview() ,有著各種參數(shù),是我們用到最多的函數(shù)。在這篇文章中,我們介紹了 pathview()的比較常見的用法,包括包安裝,數(shù)據(jù)準(zhǔn)備,以及其他有用的特性。我們也可以使用 pathxiew 的網(wǎng)頁版,地址是 。此外,Pathview 在數(shù)據(jù)整合方面有很強大的功能,包含 4800 個物種,能處理的數(shù)據(jù)屬性和格式包括 連續(xù)/離散數(shù)據(jù)、矩陣/矢量、單個/多個樣本數(shù)據(jù) ,包中還具有強大的 ID 轉(zhuǎn)換功能,這些都值得我們進一步探索。
生活很好,有你更好
【R語言】解決GO富集分析繪圖,標(biāo)簽重疊問題
前面我給大家詳細(xì)介紹過
?GO簡介及GO富集結(jié)果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結(jié)果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個圖別說美觀了,簡直不忍直視。經(jīng)過我的認(rèn)真研究,發(fā)現(xiàn)跟R版本有關(guān)。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應(yīng)的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關(guān)的函數(shù)拿出來認(rèn)真的研究了一下,終于發(fā)現(xiàn)的癥結(jié)碰侍所在。
dotplot這個函數(shù),多了個 label_format 參數(shù)
我們來看看這個參數(shù)究竟是干什么用的,看看參數(shù)說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個參數(shù)默認(rèn)值是30,當(dāng)標(biāo)簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調(diào)節(jié)一下笑咐吵這個參數(shù),把他設(shè)置成100,讓我們的標(biāo)簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復(fù)原來的容貌。
關(guān)于如何使用R做GO和簡閉KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
[R語言] GO富集分析可視化 GOplot::GOCircle
查看GOplot內(nèi)示例數(shù)據(jù)的格式,對自己的數(shù)據(jù)做處理
觀察結(jié)論:
觀察自己的兩個數(shù)據(jù)表:
table.legend 設(shè)置為T時會顯示表格
本圓族圖中表格和隱擾圖例是出圖后灶腔旦剪切拼合而成,沒有用R中的拼圖包
【R語言作圖】富集分析結(jié)果直方圖
最近小Q在做自然選擇分析,分析完之后簡單粗暴的對候選基因做了富饑姿差集分析,并做了展示,比起氣泡圖,我模仿了另一種作圖方式,顯示效果更佳。所以想在此分享一下如何爛皮用R語言畫富冊猜集分析示意圖(非氣泡圖)。
利用ggplot2+grid包進行畫圖,采用分面的思想作圖。
最終效果圖:
撰文 編輯:VickieQ
校對:HCLO4 花毛
文章名稱:r語言go富集圖 r語言畫go圖
網(wǎng)站地址:http://fisionsoft.com.cn/article/ddpsjhh.html