「重要分享」小果教你如何使用Blast轻松批量比较蛋白质和核酸。
二云健团队致力于科研
原味小水果新鲜水果
碰到序列的朋友基本上都会有一个比较的题,为了比较,基本都是需要进行爆破的,但是网页版和本地版通常都需要进行单次比较。Enter对于Linux系统,使用命令行操作。今天小果就教大家如何使用命令行进行爆炸性比较。
要执行比较,必须首先创建索引。创建索引的方法如下
makeblastdb-inscriptfa-input_typefasta-dbtypenucl-parse_seqids-outscriptfa
makeblastdb是用于构建所有内容的工具。-in参数后必须跟输入文件,-out参数后必须跟输出文件。这里的输入和输出文件可以是相同的。它是fasta格式。-dbtypenucl表示设置核酸序列的索引。要设置蛋白质序列的索引,必须将nucl替换为prot。小果整个下午都忘记换了。他意识到了。可能是致命的。
运行后你会看到如下界面
创建索引后,会出现几个文件。
构建蛋白质索引时,索引文件后缀中的第一个n将为p。
如果要比较的话,只需要使用一条命令即可。
要比较蛋白质,需要使用blastp,检查是否有蛋白质指数。
比对的结果是输出文件,在本例中为RALF_seqblast。对于结果,主要查看前三列。第一列是目标序列,第二列是与转录本或蛋白质序列文件比对的序列ID。为排序分数;分数越高,比较结果越好。
好的,这就是今天的主要内容。如果有疑请与小果分享讨论【送你的心】。
推荐书籍
跟着小果。小果将继续提供更多有用的信息。
一、ncbi如何比对两个序列?
以下是在NCBI中比较两个序列的方法
1-首先,访NCBI的BLAST网站。
2-从“选择搜索类型”下拉菜单中选择“匹配”,然后选择您要使用的匹配工具。要比较两个序列,您可以选择“局部比对器”或“多重序列比对”。
3-在“输入数据”部分中,单击“选择”按钮,然后选择本地计算机上要比较的两个序列文件。确保文件格式正确。
4-如有需要,您还可以在“参数设置”部分调整比较参数。这些参数包括预期的比对长度、比对算法、序列长度等。
5-在“输出设置”部分中,选择输出文件格式和输出文件位置。
6-单击“提交”按钮开始比较过程。排序结果在选定的输出文件中生成。
注意BLAST是一项在线服务,需要稳定的互联网连接。此外,根据序列长度以及计算机和网络速度,比对过程可能需要一些时间。
Blast程序默认执行两种对齐方法本地对齐和远程对齐,因此Blast对齐序列有两种结果。
本地比对将查询序列与本地数据库中的序列进行比较。这适合小序列比对,而远程比对将查询序列上传到NCBI服务器进行比对,适合大序列比对。因此,Blast程序产生两个结果,对应于两种比较方法的结果。用户可以根据需要选择其中一种分析结果。
发表评论