作者cb1040 (Absurde.Y)
看板R_Language
标题[问题] bioinformatics,multiple sequence align
时间Mon Nov 9 17:12:54 2015
[程式谘询] Bioinformatics的XStringset格式转换
[入门]
2010修课玩过VBA,不过之後就没了直到今日,也算新手吧
此版首po,请前辈们指教
[问题叙述]:
小弟我刚踏入bioinformatics,用Bioinfomatics with R cookbook 自学中
在MSA, Multiple Sequence Alignment部分,
使用下面这个package时卡关了
muscle, (multiple sequence comparison by log-expectation)
我的问题是:
如何转换XStringset格式,且是多笔资料转换
(有查询Biostrings 中AAString功能,但仍不知道如何使用)
[程式范例]
这是原书步骤
http://imgur.com/eFWyDjk
http://imgur.com/94zPqQQ
这是会用到的fasta档案
http://tinyurl.com/q6kjpru
以下是我的内容
pastie版 (第一次使用,还不熟,请见谅)
http://pastie.org/10540288
自己截图版
http://imgur.com/ecLpoF1
http://imgur.com/4BqdEng
http://imgur.com/rT9PEqr (後面是其他物种的序列,共十种,我就不贴了)
http://imgur.com/0WvRNXJ
因为教材有点年份,code有些出入
例如install.packages("muscle")会找不到东西
或是没有muscle::read.fasta这个功能
这里再说一次我的问题
有查询Biostrings 中 XStringset、AAString功能,但仍不会使用
想请问: 如何将多笔资料转换成XStringset格式
[环境叙述]:
直接截图
http://imgur.com/u42f95X
[关键字]: R, muscle, Biostrings, multiple sequence alignment, XStringset
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.109.125.195
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1447060378.A.A30.html
※ 编辑: cb1040 (140.109.125.195), 11/09/2015 17:46:42
1F:推 Godkin: 用readDNAStringSet("fastaMSA.fasta", format="fasta")读 11/09 23:57
2F:→ Godkin: 这个package请用bioconductor上的新版本 11/09 23:58
我用source("
http://bioconductor.org/biocLite.R")
biocLite("muscle")
library(muscle)
这样应该是从bioc那里安装最新版吧 (我看到版本都是3.12.0)
3F:→ Godkin: 多笔资料可以直接通通塞到同一个fasta档里头跑 11/10 00:00
5F:→ cb1040: biocLite ("muscle") 安装,这样应该是最新版对吧 11/10 10:25
6F:→ cb1040: 我用readXStringSet成功了!!谢谢!!! 11/10 10:38
7F:→ cb1040: 关於第三点,是我必须额外存一个新的fasta档案对吗 11/10 10:39
※ 编辑: cb1040 (140.109.123.109), 11/10/2015 10:49:53
※ 编辑: cb1040 (140.109.123.109), 11/10/2015 10:56:05
8F:推 Godkin: 对, 可以用cat去串联每个fasta档 11/10 17:16