阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 9|回复: 0

[论文] 《自适应精度保留的浮点数时间序列无损压缩算法研究》作者:刘于溪,瞿有利【PDF】

[复制链接]

用户组:分区版主

我,秦始皇,打钱

爱心会员勋章重建论坛爱心会员勋章重建论坛勋章版主勋章分区版主勋章

      UID
51
      积分
21110
      回帖
1377
      主题
2163
      发书数
757
      威望
16183
      铜币
85196
      贡献
2400
      阅读权限
100
      注册时间
2025-2-27
      在线时间
3914 小时
      最后登录
2025-12-17
发表于 2025-8-1 21:01 | 显示全部楼层 |阅读模式
  自适应精度保留的浮点数时间序列无损压缩算法研究
  刘于溪,瞿有利
  (北京交通大学交通大数据与人工智能教育部重点实验室,北京100044)
  摘要:现有的浮点数时间序列无损压缩算法主要分为两类:基于异或操作的压缩算法和基于十进制的压缩算法。基于异或操作的压缩算法通过异或运算去除相邻两个浮点数在IEEE754表示中的冗余部分,随后利用编码技术复用异或结果的前导零和中心有效位的长度,从而实现对浮点数的压缩。然而,这种方法在处理两个值相近的浮点数时,其IEEE754表示可能仍存在显薯差异,导致实际应用中复用情况较少。因此,该类算法在某些情况下对原始数据的压缩效果不佳,甚至可能无法实现有效的压缩。基于十进制表示的压缩算法通过将二进制浮点数与10的n次方乘,将其转换为相应的整数,以便进行压缩。然而,当小数精度不一致时,该类算法可能会导致较大的存储空间需求。本文提出了一种自适应精度保留的浮点数时间序列无损压缩算法(APCF)。APCF算法可分为两个主要阶段:预处理阶段和编码阶段。在预处理阶段,算法首先自适应地计算每个浮点数对应的十进制表示的精度,然后根据该精度对浮点数进行量化。通过异或操作,算法去除原始数据中的冗余信息,并将有效信息集中在低位。在编码阶段,算法分别使用游程编码器和改进的异或值编码器对精度值和异或值进行编码。实验结果表明,APCF算法在18个数据集上的平均压缩率达到0.23。与ALP算法相比,APCF算法的平均压缩率提升了18.2%;与ELF算法相比,平均压缩率提升了19.9%。项目源码见https://github.com/xiaoYu0103/osptBWT.git.
  关键词:浮点数时间序列;无损压缩;自适应精度
  中图分类号:TP315




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +1 铜币 +2 收起 理由
飞乌与渔 + 1 + 2 论坛有您更精彩!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-12-17 17:26 , Processed in 0.145624 second(s), 30 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表