More than 5 years have passed since last update.
Rをつかって、multi_fastaファイルから、配列名が同じものを切り出して、1つのファイルにまとめる。
配列の由来がわかるように、個別の名前もつけておく.
2つの生物種の全遺伝子が1ファイルにそれぞれまとまっているときに、
それぞれからオーソログ遺伝子を取り出して、別ファイルにするときなどを想定
select.R
# パッケージのインストール# source("http://bioconductor.org/biocLite.R")# biocLite("Biostrings")# パッケージのロードlibrary(Biostrings)# 指定したファイルを読み込むF1<-readDNAStringSet("./Fasta1.fa")F2<-readDNAStringSet("./Fasta2.fa")F1_name<-names(F1)F2_name<-names(F2)names(F1)<-sub("^","f1_",names(F1))names(F2)<-sub("^","f2_",names(F2))# for文で要素ごとに書き出すfor(iin1:length(F1)){for(jin1:length(F2)){if(F1_name[i]==F2_name[j]){outFileName<-paste(F1_name[i],"fa",sep=".")writeXStringSet(c(F1[i],F2[j]),file=outFileName)}}}Register as a new user and use Qiita more conveniently
- You get articles that match your needs
- You can efficiently read back useful information
- You can use dark theme
