从fasta中提取或者过滤掉多个序列
序列 多个 提取 或者 过滤
2023-09-27 14:27:39 时间
Google了一下,现成的工具不多。
自己写代码也可以,就是速度肯定不快,而且每次写也很麻烦。
偶然看到QIIME的filter_fasta.py有这个功能,从name list中提取多个序列。
filter_fasta.py -f extract_no_N_200.fasta -o remain.fasta -s out.list
[REQUIRED] -f, --input_fasta_fp Path to the input fasta file -o, --output_fasta_fp The output fasta filepath [OPTIONAL] -m, --otu_map An OTU map where sequences ids are those which should be retained. -s, --seq_id_fp A list of sequence identifiers (or tab-delimited lines with a seq identifier in the first field) which should be retained. -b, --biom_fp A biom file where otu identifiers should be retained. -a, --subject_fasta_fp A fasta file where the seq ids should be retained. -p, --seq_id_prefix Keep seqs where seq_id starts with this prefix. --sample_id_fp Keep seqs where seq_id starts with a sample id listed in this file. Must be newline delimited and may not contain a header. -n, --negate Discard passed seq ids rather than keep passed seq ids. [default: False] --mapping_fp Mapping file path (for use with –valid_states). [default: None] --valid_states Description of sample ids to retain (for use with –mapping_fp). [default: None]
60w条序列瞬间就处理完了。
相关文章
- 机器学习笔记二-----------------Prophet(时间序列模型)的复杂例程笔记及给jupyter添加多个python版本的kernel的方法
- 异常检测:综述(基本都是无监督算法)【时间序列算法:AR/MA/ARMA】【传统机器学习算法:孤独森林、One Class SVM】【深度学习算法:AutoEncoder、LSTM、DeepLog】
- 【wikioi】2216 行星序列(线段树)
- 【Python3练习题 019】 有一分数序列:2/1,3/2,5/3,8/5,13/8,21/13...求出这个数列的前20项之和。
- php数组函数序列之array_unshift() 在数组开头插入一个或多个元素
- LeetCode_动态规划_困难_940.不同的子序列 II
- PostgreSQL 空间、多维 序列 生成方法
- AcWing 2816. 判断子序列
- 【ybt高效进阶强化训练1-1-4】序列个数(分类讨论)