最近2018中文字幕在日韩欧美国产成人片_国产日韩精品一区二区在线_在线观看成年美女黄网色视频_国产精品一区三区五区_国产精彩刺激乱对白_看黄色黄大色黄片免费_人人超碰自拍cao_国产高清av在线_亚洲精品电影av_日韩美女尤物视频网站

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
如何進(jìn)行R語言用DNA序列做主成分的分析

這篇文章將為大家詳細(xì)講解有關(guān)如何進(jìn)行R語言用DNA序列做主成分的分析,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。

成都創(chuàng)新互聯(lián)公司專業(yè)為企業(yè)提供通城網(wǎng)站建設(shè)、通城做網(wǎng)站、通城網(wǎng)站設(shè)計(jì)、通城網(wǎng)站制作等企業(yè)網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)與制作、通城企業(yè)網(wǎng)站模板建站服務(wù),十多年通城做網(wǎng)站經(jīng)驗(yàn),不只是建網(wǎng)站,更提供有價(jià)值的思路和整體網(wǎng)絡(luò)服務(wù)。

之前也有人留言問過如何用DNA序列做主成分分析,當(dāng)時(shí)我也不知道,但是大體有一個(gè)思路 就是先比對(duì),然后把比對(duì)的數(shù)據(jù)轉(zhuǎn)換成通常用的snp數(shù)據(jù)應(yīng)該就可以了,但是也僅限于思路,完全不知道如何操作,今天坐車回家,路上無聊,翻了一下電腦上保存的一些資料,發(fā)現(xiàn)了一個(gè)辦法:可以借助R語言的adegenet包,用到的函數(shù)是fasta2genlight()

 fasta2genlight()函數(shù)的只要作用

The function fasta2genlight extracts SNPs from alignments with fasta format. 從比對(duì)好的fasta文件中提取snp數(shù)據(jù)

 下面開始實(shí)際操作

adegenet這個(gè)包第一使用需要先安裝,直接運(yùn)行如下命令

install.packages("adegenet")
 

今天的推文使用的數(shù)據(jù)集是這個(gè)包的內(nèi)置數(shù)據(jù)集,首先是獲取這個(gè)數(shù)據(jù)集的存儲(chǔ)路徑

dfpath<-system.file("files/usflu.fasta",package="adegenet")
dfpath
   加載包讀入數(shù)據(jù)
library(adegenet)
flu<-fasta2genlight(dfpath,chunkSize = 10,parallel = F)
flu
   

數(shù)據(jù)讀入以后做一些分析就比較容易了

 首先是看一下snp位點(diǎn)在染色體上的分布密度
library(ggplot2)
snpposi.plot(position(flu),genome.size = 1700,codon = F)+
  theme_bw()
 
如何進(jìn)行R語言用DNA序列做主成分的分析  
image.png
 還可以劃分不同的密碼子位置
snpposi.plot(position(flu),genome.size = 1700,codon = T)+
  theme_bw()
 
如何進(jìn)行R語言用DNA序列做主成分的分析  
image.png

這個(gè)圖如果分面畫成山脊圖的形式可能會(huì)更好看,但是自己目前還不知道如何實(shí)現(xiàn)

 還能夠檢測(cè)snp在染色體上是否分布均勻
snpposi.test(position(flu),genome.size = 1700)
 

這一步的時(shí)間可能會(huì)比較長如何進(jìn)行R語言用DNA序列做主成分的分析

 接下來是做主成分分析了
df.pca<-glPca(flu,nf=3)  
df.pca.scores<-as.data.frame(df.pca$scores)  
df.pca.scores
   
自己隨便構(gòu)造一個(gè)分組信息,然后用散點(diǎn)圖加置信橢圓的方式展示結(jié)果
df.pca.scores$population<-ifelse(df.pca.scores$PC1>0,"pop1",
                                 ifelse(df.pca.scores$PC2>1,"pop2","pop3"))
library(ggplot2)
ggplot()+
  geom_point(data=df.pca.scores,
             size=2,
             aes(x=PC1,y=PC2,
                 color=population))+
  theme_bw()+
  stat_ellipse(data=df.pca.scores,
               aes(x=PC1,y=PC2,fill=population),
               geom = "polygon",alpha=0.2,lty="dashed",color="black")
 
如何進(jìn)行R語言用DNA序列做主成分的分析  
image.png

關(guān)于如何進(jìn)行R語言用DNA序列做主成分的分析就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。


文章名稱:如何進(jìn)行R語言用DNA序列做主成分的分析
當(dāng)前鏈接:http://fisionsoft.com.cn/article/gjoogh.html