KEGG批量注释
pip安装:
(1)出现的问题网址:https://www.cnblogs.com/saolv/p/6963314.html
(2)安装:
sudo yum -y install epel-release
sudo yum -y install python-pip
PySQLite 的安装:
(1) 出现的问题error: command ‘gcc’ failed with exit status 1;
解决方案如下
(参考网址:https://blog.csdn.net/u010445516/article/details/76850704);
yum install libsqlite3x.x86_64 #使用命令yum search sqlite3进行搜索,然后选择libsqlite3x.x86_64并安装
yum install libsqlite3x-devel #使用命令yum search sqlite3进行搜索,然后选择libsqlite3x-devel并安装
sudo pip install PySQLite
NCBIblast 的安装:
wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.7.1+-x64-linux.tar.gz
tar -zxvf ncbi-blast-2.7.1+-x64-linux.tar.gz
echo 'export PATH=/root/biosoft/ncbi-blast-2.7.1+/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
KOBAS 安装:
出现的问题:
(1)如果rpy2报错,直接重装rpy2,命令:pip install rpy2==2.7.8
- download kobas (http://kobas.cbi.pku.edu.cn/help.do)
kobas-3.0.3.tar.gz、organism.db.gz、ko.db.gz、ko.pep.fasta.gz
- R ,qvalue的安装
- source("http://bioconductor.org/biocLite.R")
- biocLite("qvalue")
- python 相关模块安装
sudo pip install rpy2==2.7.8 #支持python2,
sudo pip install BioPython
sudo pip install PySQLite
- ncbi-blast-2.2.31+-x64-linux.tar.gz
tar -zxvf ncbi-blast-2.2.31+-x64-linux.tar.gz
echo 'export PATH=/root/biosoft/ncbi-blast-2.7.1+/bin:$PATH' >> ~/.bashrc
- install kobas
tar -zxvf kobas-3.0.3.tar.gz
cd kobas-3.0/
- 将压缩包 organism.db.gz 和 ko.db.gz 拷贝到 sqlite3文件夹下
gzip -d organism.db.gz
gzip -d ko.db.gz
- 将压缩包ko.pep.fasta.gz拷贝到seq_pep文件夹下
gzip -d ko.pep.fasta.gz
- 将KOBAS软件的执行脚本添加到 ~/.bashrc
echo 'export PATH=$PATH:/root/biosoft/kegg/kobas-3.0/scripts' >>~/.bashrc
- 安装KOBAS相应的模块到python中,注意:不是kobas-3.0/src/kobas目录
echo 'export PYTHONPATH=$PYTHONPATH:/root/biosoft/kegg/kobas-3.0/src' >> ~/.bashrc
- 修改kobasrc中的kobas_home和blast_home
kobas_home = /root/biosoft/kegg/kobas-3.0
blast_home = /root/biosoft/ncbi-blast-2.7.1+/bin
cp kobasrc ~/.kobasrc #将kobasrc文件拷贝到~/.kobasrc目录下
6 KOBAS 的使用
若出现如下类似的问题:
unable to load shared object /xxxx/xxx/R-install/lib64/R/library/stats/libs/stats.soundefined libRlapack.so: cannot open shared object file: No such file or directory
则解决方案为:
export R_HOME=/usr/local/lib64/R/ #设置R的工作目录
export LD_LIBRARY_PATH=${R_HOME}/lib:${LD_LIBRARY_PATH} #设置动态库的查找路径
使用命令 (加粗部分为自己要填写的内容):
annotate.py -i all_genomic_gene.fasta -s ko -t fasta:nuc -o
all_genomic_geneGene.ann -n 4
annotate.py -i diff_gene.fasta -s ko -t fasta:nuc -o diff_gene.ann
-n 4
identify.py -f diff_gene.ann -b all_genomic_gene.ann -d K -o
kegg.result.xls
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击