节省60%费用!巧用阿里云归档存储降低基因测序成本
“如果有款存储产品能在保证业务正常运行的时候节省60%的成本,我会毫不犹豫选择它”。
我的工作是做生物基因测序的,我们公司很早就在云上搭建了数据分析平台(云的优势不多说了,省心省钱),数据通过采集设备生成后,会立即上传到云端进行预订的测序分析。当然了,考虑到算法更新,这些数据都是保存在云端的,有了新的分析方法就可以进行更多维度的分析,无需重新采集。
存储周期长是基因数据的特点,在采集后的最初几个月内会被频繁访问,对于数据实时的响应性要求极高。但经过开始的几个月后,原始数据访问频率就开始大幅下降,所以我们尽量会寻找不同访问特性的存储,去降低总存储成本。
之前我们用的一直是阿里云的OSS标准存储,虽然速度快、延迟低、吞吐能力强,但对我们业务的不同时期来说有些“性能过剩”。所以当我们看到阿里云新上线的归档存储OSSArchive的价格的时候,说句实话,挺惊讶的:毕竟这款产品比OSS便宜得多。然后又想到阿里云看的挺远,不免有些服气。
归档存储有多便宜呢?相比标准存储低了近60%,适用于长期(几年甚至更长时间)存储的归档数据取回。按照存储容量300TB来计算,如果使用归档类型存储一年是221184元,即使与300TB年存储包相比,也可节省11万元以上。
对基因行业,这是个非常大的惊喜,因为每个基因文件的大小在几GB到几十GB不等,随着基因测序的需求增加,存储规模增长非常快,其在总成本中占有的比例也在不断增大。
另一个吸引我的地方是归档存储采用的是OSS标准API,跟我们现有的数据管理与分析平台完全配套,无需进行平台改造。
归档存储的上手非常简单,我们经过了几天的方案验证后,很快完成了全新的业务架构搭建。
下面是一个归档类型Bucket创建、文件上传、查询、解冻与下载的简单流程:
首先通过控制台创建一个归档类型Bucket,当前阿里云OSS开放的是华北2(北京)区域,开通归档类型Bucket流程和其他存储类型Bucket是相同的。
OSS提供的ossutil工具可以自动根据文件大小适配上传模式,包括PUT 上传、分片上传。基因文件普遍都是GB级以上,需要通过分片机制,将大文件能够拆分成多个片段独立上传。
3、查询文件列表OSS API和相关工具可以实时查询文件列表。
归档存储与标准类型在读取Object前,需要有一个Restore操作,按照OSSArchive文档中介绍,上传到归档类型的Object处于冷冻状态,需要先解冻后进入到可读取状态,Restore操作后需要等待1~4个小时的等待时间。
在Restore解冻过程中的Object会显示ongoing-request="true"。
解冻完成后,查询Object状态会显示解冻完成可以直接下载,expiry-date为过期时间,过期时间一到,Object会重新进入冷冻状态。
解冻操作是需要收取费用的,每解冻 1GB数据需要0.06元,所以不需要立即使用的Object还是让它安安静静的保存吧。解冻完成24小时后Object会重新回到冷冻状态,参考官网文档处于解冻状态下,可以通过多次调用Restore,使Object最长保持七天可读状态。
已经解冻的Object可以和标准类型的Object一样的下载方式 。
对于基因数据的管理,我们对每个基因文件的元信息使用了数据库保存,每个基因文件都会记录上传时期和近半年内使用信息,对于上传时间超过一定时期并且长期没有访问的基因文件,会从标准类型的Bucket中迁移到归档类型Bucket。
归档存储类型总体使用下来的体验不错,也给OSS产品提个建议吧,希望后期能支持加入Restore解冻完成的事件通知,现在应用程序实现中都是每隔一小时去获取下Restore的状态。
来源:搜狐网
原文链接
函数计算助力石墨文档突破性能瓶颈,有效节省58%服务器成本 石墨文档 是中国第一款支持云端协作的企业办公服务软件(功能类比于Google docs、Quip等),可以实现多成员多终端的在线实时协作,同步响应速度达到毫秒级,是团队协作的最佳选择。 石墨文档还是一款具有中国式美感的科技产品,2015 年获得极客公园最佳互联网创新产品 50 强。
浅析软件成本估算之NESMA方法的3种应用场景 NESMA为荷兰软件度量协会的简称(Netherland Software Measurement Association),NESMA功能点方法是五种ISO国际功能点标准之一,不但易学易用、快速、经济,而且容易开发和建立用户自己特有的估算模型。
MaxCompute存储力持续升级,每年节省不止一个亿 MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速、完全托管的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。
DDoS攻击服务到底需要多少费用?哪些因素决定着其最终成本? 本文讲的是DDoS攻击服务到底需要多少费用?哪些因素决定着其最终成本?,DDoS攻击服务的成本是多少?近日,卡巴斯基实验室发布了黑客市场DDoS攻击和服务成本分析报告,给了我们一个答案。
相关文章
- rds - mysql修改存储过程/函数的方式
- JavaWeb_JSTL标签数据的存储
- s3c2440存储控制器和地址以及启动的理解
- 阿里云徐立:面向容器和 Serverless Computing 的存储创新
- 为什么密码要以MD5值存储在数据库
- Python Django 数据缓存存储位置类
- 阿里OSS图片存储java代码示例
- 【云原生 | Kubernetes 系列】使用PVC存储构建Zookeeper集群搭建
- MySql的多存储引擎架构, 默认的引擎InnoDB与 MYISAM的区别(滴滴 阿里)
- 正确使用阿里云NAS文件存储服务系列之文件权限校验
- Atitit 数据库存储引擎 目录 1.1. BLACKHOLE 黑洞引擎 1 1.2. Myisam innodb 1 1.3. Archive 档案类 1 1.4. Fed 连接引擎 2 1.
- Atitit 数据库映射到redis存储的模式 1. 常规 每条db记录映射一个redis记录1 1.1. 表名:主键为key ,记录序列化为json为val1 2. 每个字段映射一个redi
- Oracle 存储过程和方法全攻略:实战详解调用技巧与注意事项
- mysqldump导出--数据+结构+(函数+存储过程)
- 二叉树的二叉链表存储
- 阿里云数据库产品HybridDB简介——OLAP数据库,支持行列混合存储,基于数据库Greenplum的开源版本,并且吸收PostgreSQL精髓
- mongodb底层存储和索引原理——本质是文档数据库,无表设计,同时wiredTiger存储引擎支持文档级别的锁,MMAPv1引擎基于mmap,二级索引(二级是文档的存储位置信息『文件id + 文件内offset 』)
- Elasticsearch压缩索引——lucene倒排索引本质是列存储+使用嵌套文档可以大幅度提高压缩率
- Python实现将图片上传到基于阿里云OSS对象存储的图床
- 【博客584】pod多种方式挂载远程存储
- 阿里云对象存储OSS如何收费?OSS对象存储价格详解
- MySQL 创建存储过程,使用 while 批量插入数据