zl程序教程

您现在的位置是:首页 >  其他

当前栏目

TBtools | 序列提取及过滤

2023-04-18 14:39:19 时间

本期讲解的是TBtools序列工具中的Fasta序列提取及过滤。进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。

Fasta序列提取及过滤分为四个工具:

Fasta Extract (Recommended)

Fasta Extract or Filter (Quick)

Fasta Extract (Basic)

Fasta Subseq (Basic)

一般推荐使用Fasta Extract (Recommended)即可,包含其他三个几乎所有功能。唯一不同的是Fasta Extract or Filter (Quick)中包含了过滤的功能,在这里不做赘述了。

为了便于演示,我虚构了一个名为test.fasta的序列文件,如下:

>contings-1
AGCAATTCCACCTTCGTAA
>contings-2
AAGTCACCAGGGGATGCAA
>contings-3
TCTGTTTCACACTCATCTT
TAAAGGTAGTTTCAATAAT
>contings-4
AGTGCCATTTCTTTAAATA
TCACTTTTTTATCTTCTCT
TTTAAAATTAACAACATTA
>contings-5
TAATAAGTCACAGTCATGC
ATTGCATTATTAGCTTCAT
AAGTTCCGTGCATTCCAAG
CATTCCTAAAAATTGATTA
TCATTTCCAGGATAAGCAC
CTAGGCCTTGTAAAGTTGA
>contings-6
GCATGTGCATGACCTTGGC
TTCCATAACCAAAAATTGC
TATTTTTTTACTTTTAATT
AAATCTACATCTGCATCTT
ATAAAACATTTTCATTTTT

Fasta Extract (Recommended)主要功能包括:

(1)提取Fasta序列文件中的某一个或者多个基因

在这里我们选择提取test.fasta中contings-1和contings-6。

输出结果:

>contings-1
AGCAATTCCACCTTCGTAA
>contings-6
GCATGTGCATGACCTTGGCTTCCATAACCAAAAATTGCTATTTTTTTACTTTTAATTAAA
TCTACATCTGCATCTTATAAAACATTTTCATTTTT

(2)提取Fasta序列文件中的序列区段

在这里我们选择提取test.fasta中contings-1的2-6号碱基、contings-3的4-8号碱基、contings-6的1-3号碱基。

输出结果:

>contings-1 2 6
GCAAT
>contings-3 4 8
GTTTC
>contings-6 1 3
GCA