三种东西永远不要放到数据库里
改进你的系统的最好的方法是先避免做“蠢事”。 我并不是说你或你开发的东西“蠢”,只是有些决定很容易被人们忽略掉其暗含的牵连, 认识不到这样做对系统维护尤其是系统升级带来多大的麻烦。
作为一个顾问,像这样的事情我到处都能见到,我还从来没有见过做出这样的决定的人有过好的结果的。
图片,文件,二进制数据
既然数据库支持BLOB类型的数据,把文件塞进BLOB字段里一定没有错了!?错,不是这样的! 别的先不提,在很多数据库语言里,处理大字段都不是很容易。
把文件存放在数据库里有很多问题:
- 对数据库的读/写的速度永远都赶不上文件系统处理的速度
- 数据库备份变的巨大,越来越耗时间
- 对文件的访问需要穿越你的应用层和数据库层
这后两个是真正的杀手。
把图片缩略图存到数据库里?很好,那你就不能使用nginx或其它类型的轻量级服务器来处理它们了。
给自己行个方便吧,在数据库里只简单的存放一个磁盘上你的文件的相对路径,或者使用S3或CDN之类的服务。
短生命期数据
使用情况统计数据,测量数据,GPS定位数据,session数据,任何只是短时间内对你有用,或经常变化的数据。 如果你发现自己正在使用定时任务从某个表里删除有效期只有一小时,一天或数周的数据, 那说明你没有找对正确的做事情的方法。 使用redis,statsd/graphite, Riak,它们都是干这种事情更合适的工具。 这建议也适用于对于收集那些短生命期的数据。
当然,用挖土机在后花园里种土豆也是可行的,但相比起从储物间里拿出一把铲子, 你预约一台挖土机、等它赶到你的园子里挖坑,这显然更慢。 你要选择合适的工具来处理手头上的事。
日志文件
把日志数据存放到数据库里,表面上看起来似乎不错,而且“将来也许我需要对这些数据进行复杂的查询”, 这样的话很得人心。这样做并不是一个特别差的做法, 但如果你把日志数据和你的产品数据存放到一个数据库里就非常不好了。
也许你的日志记录做的很保守,每次web请求只产生一条日志。 对于整个网站的每个事件来说,这仍然会产生大量的数据库插入操作, 争夺你用户需要的数据库资源。 如果你的日志级别设置为verbose或debug,那等着看你的数据库着火吧。
你应该使用一些比如Splunk Loggly或纯文本文件来存放你的日志数据。 这样去查看它们也许会不方便,但这样的时候不多,甚至有时候你需要写出一些代码来分析出你想要的答案, 但总的来说是值得的。
可是稍等一下,你是那片不一样的雪花,你遇到的问题会如此的不同, 所以,如果你把上面提到的三种东西中的某一种放到了数据库里也不会有问题。 不,你错了,不,你不特殊。相信我。
相关文章
- 国际物理学十大进展公布我国量子计算优越性实验入选
- 下一代互联网?高盛、马斯克和多尔西热议Web3到底是什么?
- 最新3D GAN可生成三维几何数据了!模型速度提升七倍
- 数据缩至1/5000,模型准确率却翻倍,谷歌新“蒸馏法”火了
- 上海交大启用中国高校最强超算!上算引力波,下算光量子
- 老旧电脑还有救吗? 锐捷网络推出“终端云化小黑卡”,成就PC利旧“极简之道”
- 挑战人类认知推理新任务,MIT等联合提出新一代视觉推理数据集
- 超级计算机预测六夸克粒子存在
- 一日一技:这个使用场景,etcd 比 Redis 强
- 国产高端芯片实力如何?六位资深业内人士这样看
- springboot搭建
- 哈佛大学:未来10年中国将在半导体、生物技术等领域超越美国
- 猫=图灵机?四项测试证明,「猫猫计算机」可执行任意计算
- 等待芯片交付的时间再度拉长 缺货现象料难改善
- 单片机实验2提示
- 单片机实验3提示
- Web3.0是什么?将要重建互联网
- 谷歌让NLP模型也能Debug,只要给一张「草稿纸」就行
- 恒生电子发布金融分布式数据库LightDB,持续助力金融行业信创建设
- 达摩院成功研发存算一体AI芯片,性能提升10倍以上