大连仟亿科技
客服中心
  • 电话
  • 电话咨询:0411-39943997
  • 手机
  • 手机咨询:15840979770
    手机咨询:13889672791
网络营销 >更多
您现在的位置:仟亿科技 > 新闻中心 > 常见问题

如何在Rails中压缩存储文本数据

作者:billionnet 发布于:2012/9/4 17:05:44 点击量:

 今天小编说一下如何在Rails中,将大段文本内容以压缩格式存在数据库。这也是从公司的一个项目中获得的灵感。

原始需求

手头有一个结构简单的文本库,可以看做是key=>value。约180万条数据,2.8G(确实不算大,见笑了)。

  1. 这个库查询频繁,CPU在IOWAIT耗时颇多。
  2. Linode服务器硬盘紧张,而CPU富裕。
  3. 若能通过压缩减小体积,备份/回导时也会更省时。

实施过程

整个实施过程做到了无缝转换,不需要停服务。

第一步:将文本字段类型由TEXT修改为BLOB;新增一个is_gzip字段用于标识是否经过压缩,默认为0。

* 需要注意,BLOB和TEXT最长支持65535字节。

第二步,修改Rails相应的Model。代码示例(压缩content字段):

class TextData < ActiveRecord::Model
  def content
    if self.is_gzip
      Zlib::Inflate.inflate(super)
    else
      super
    end
  end

  def content=(info_content)
    super Zlib::Deflate.deflate(info_content, 9)
    self.is_gzip = true
  end
end

再一次感叹super的便捷。修改代码后,需要重新部署一下Rails应用。

第三步,创建一个rake任务,用来批量做转换。关键部位只消这么做:

text_data.content = text_data.content
text_data.save

第四步,在做过修改的表上做一次optimize table,以释放那些不需要的空间。

效果观察

  1. 经如上处理,2.8G数据只剩1.4G。如果用了Gzip而不用Deflate,有可能更小。
  2. IOWAIT未见明显下降。压缩前,单条记录理论上可以通过一次IO完成。
  3. 备份的速度确实有所提升,意料之中。

很多信息

  1. 这种思路同样适用于PHP、Python以及其他语言下的Web应用,只是在Rails中搞起来更为轻松。
  2. Mysql提供了Compress/Uncompress两个函数,但是不建议直接使用。一方面会增加数据库服务器计算的压力;另一方面,如果用了主从,每个服务器都得算一次。
  3. Zlib::Deflate.deflate 的第二个参数是压缩的level。我用随机数据测试,Level 9压缩后的体积比Level 1 小10%。
  4. 如果用了Sphinx之类的从数据库导出数据的全文检索引擎,此法需慎用。


分享到:


评论加载中...
内容:
评论者: 验证码:
  

Copyright@ 2011-2017 版权所有:大连仟亿科技有限公司 辽ICP备11013762-1号   google网站地图   百度网站地图   网站地图

公司地址:大连市沙河口区中山路692号辰熙星海国际2215 客服电话:0411-39943997 QQ:2088827823 42286563

法律声明:未经许可,任何模仿本站模板、转载本站内容等行为者,本站保留追究其法律责任的权利! 隐私权政策声明