生物信息学常见数据格式
2023-03-07 09:41:33 时间
生信技能树学习笔记
fasta
一种基于文本用于表示核酸序列或多肽序列的格式,缩写为fa
特征:两部分
-id行:以“>”开头,有时候会包含注释信息
-序列行:一个字母表示一个碱基/氨基酸,ATCGN 或 20种氨基酸
fastq
一种保存生物序列(通常为核酸序列)及其测序质量得分信息的文本格式
通常有四行
第一行 @开头,之后为序列的标识符以及描述信息
第二行 为序列信息,如ATCG
第三行 +开头,之后可以再次加上序列的标识符以及描述信息
第四行 为碱基质量值,长度与第二行一一对应
gff
相关文章
- set 方法是坏味道?
- 做这么多年程序员了,才把ELK和springboot的日志解决方案弄明白
- ThinkPHP 6 数据库断线重连
- 数据结构---单向链表
- js Symbol数据类型
- 大数据NiFi(十):集群页面导航、操作区介绍和模板操作
- vue3 setup语法糖
- Spring Boot 构建多租户系统 实现动态切换数据源
- 这套设备管理方案助你效率10倍提升
- form表单中的enctype属性
- 【生信技能树培训】R语言中文件的读取
- html5视频背景插件vidbacking
- WordPress零基础新手建站完整教程
- Mac MongoDB 安装
- ACL 2022 | 基于长度感知注意机制的长度可控摘要模型
- koa 实现一个翻页查询
- 【k哥爬虫普法】简历大数据公司被查封,个人隐私是红线!
- 大文件geojson渲染,geojson转pbf矢量切片工具下载!
- 【k哥爬虫普法】非法入侵计算机信息系统,获取1500万余条个人信息!
- 【k哥爬虫普法】爬取数据是否一定构成不正当竞争?