Las与Laz点云文件格式的区别

本文主要是介绍Las与Laz点云文件格式的区别，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Las与Laz点云文件格式的区别

Las与Laz点云文件的读取
Las
Laz
点集压缩
LASzip
读取las与laz实验

Las与Laz点云文件的读取

最近研究了一下点云文件格式las与laz，读取方式的话调用的是LAStools库。编译方式没有什么特别的，可能Cmake生成后编译不通过，原来每个exe中的cpp文件有一行代码少了个括号，自行加上即可。通过对代码的调试与文献阅读，总体有以下两点结论：

las与laz相比，其占用磁盘内存减少，大概在4倍左右；
laz较las读取时间降低，测试了一个8个G的与一个6个G的文件，效率降低也在4倍左右。通过CloudCompare进行导入，也能够明显地感觉出来导入速度变慢。

文献主要是一篇Laszip对应的文章，详细讲述了las是如何压缩为laz的。但是我还在研究这篇文章，所以本文暂时不详细讲述具体压缩方法，只讲述自己所做实验与以上两点造成的原因，纯属个人理解，望评！这里附上文章下载链接：《LASzip: lossless compression of LiDAR data》不过好像需要翻墙，推荐使用翻墙软件PSIPHON。

Las

首先介绍一下Las格式的点云存储方式。对于每条扫描脉冲来说，扫描仪记录了返回波段。扫描仪脉冲可能有多个峰值，因为激光在到达地面之前可能撞击到多种表面，如电线或者天线、树叶甚至小鸟。每一个在一定阈值以上的峰值成为一个“返回”。这些带有反射强度，扫描角度，GPS时间，返回数值，飞行先ID等等的坐标信息是我们感兴趣的数据。为了在不同软件中实现数据格式交换，通常的做法是将坐标文件转换为ASCII格式，每一行代表一个“返回”的属性。这种方法虽然灵活病便于理解，但是用文本格式存储百万甚至千万级别的记录是十分笨拙的，更重要的是无法在文件中进行查找。

直到Las 1.3，每一个点记录有核心的20个bytes，其中12个bytes记录了整数形式的xyz坐标。LAS的头信息记录了对于整数坐标的缩放因子。剩下的8个bytes储存了反射强度信息，扫描角度，返回数量，分类信息等等。这些信息组成了基本的point type 0。另外point type 1和3添加了8 byte的GPS time，point type 2与3 增加了6 byte来存储RGB颜色信息。LAS 1.3引入了point type 4和5 允许附加对于每个“返回”的波形信息，但是很少使用。使用浮点数的表示形式意味着数字的精度取决于数字不同的值。越靠近0，精度越高。

从上述可以看出，LAS格式最大的特点就是在存储点坐标时使用缩放因子与平移量的方式。其实，很多人都认为浮点数比整数具有较高的精度，但这是错误的概念。论文里有具体的分析，大家可以仔细阅读。LiDAR坐标大多分布在x-y平面上，这是因为使用了大地坐标与高斯投影的缘故。

Las 1.0-1.3在实际的点数据之前存在一个头信息。前227 bytes的头信息定义了Las文件，包含了变长记录的数量，相对于第一个点的平移量，每个点的类型和大小，点云数量，整数点坐标的平移量和缩放因子以及点云的包围盒。在LAS 1.3中，每个点都附加了一个波形信息，共235 bytes。额外的8 bytes信息描述了波形数据的开始。如果这个字段为0，则波形数据存储在外部的WDP文件中。如果这个字段不为0，波形数据存储在LAS文件内。LASzip还不支持波形数据在LAZ文件内，总是把它写在外部的WDP文件。

Laz

Laz文件是Las文件的一种压缩格式，在LAStools中就有Laszip这个exe，可以直接调用。Laszip压缩器把Las数据中点类型看做四种不同的数据组成的：POINT10，GPSTIME10，RGB12和WAVEPACKET13，针对这个四种数据分别进行压缩。例如，点类型3是由POINT10后面跟着GPSTIME10和RGB12组成的。另外，每个点可能有一个“n”在最后，称作“额外的bytes”。

点集压缩

有损于无损
有损压缩方案通过轻微的改变点的位置，即坐标，并且能够保证物体表面的基本形状即可。这种方案主要应用在只要求可视化效果的程序中。而无损压缩方案通过使用“uniform precision”把点坐标改成用缩放因子表示的数值，即修改量化点坐标的形式。
progressive versus non-progressive (or single-rate)(我没理解这一部分)
流和非流
流方案在读取一部分数据之后开始压缩点并输出压缩文件，反之，在在只读取一部分压缩文件后开始解压缩。非流方案在压缩与解压缩的时候都是将点全部读进内存。
点重排列与保持原始顺序
点重排列方案不在文件中保持原始点顺序，它的压缩增益来源于将点重新排列成一种聪明的顺序。
保持原始顺序则反之。
连续的和随机获取
连续方案依照点在压缩文件中的编码方式解压缩。随机获取方案可以在压缩文件中搜索并且只解压一部分文件。

The LASzip compressor is lossless, non-progressive,
streaming, order-preserving, and provides random-access.

LASzip

laszip不对Las的头信息或者任何变长记录进行压缩。变长记录如下图所示
在这里插入图片描述
它只是从las文件拷贝到laz文件中。然而它对当前的point type值加上128来防止标准的LAS读取器尝试读取压缩后的LAZ文件。另外增加了一个变长记录指明了压缩的点和使用的不同的压缩选项的构成。LASzip压缩器把不同的点类型看做由四部分组成：POINT10，GPSTIME10，RGB12和WAVEPACKET13。每一项都有自己的压缩器，并且它们自己具有版本号，使得压缩器模块化，并且易于扩展到其他点类型。

LASzip压缩器对点集进行分块压缩，这使得在压缩文件中可以进行查找。默认的块大小为50000个点。Chunking makes it possible to, for example, augment the produced LAZ files with spatial indexing LAX files [2] and support area of- interest queries that decompress only the relevant parts of a compressed LAZ file。因为每一个压缩的块都具有不同的大小，压压缩器在文件末尾存储了一个“chunk table”，指明每一块的开始byte位置。

当开始一个新的chunk时，Laszip把第一个点存储为原始的字节，作为后来的预测方案的初值。以下所有的点数据都按一项一项的压缩。这里的项就是上述的POINT10，GPSTIME10，RGB12和WAVEPACKET13。
文章中针对每一项的压缩方案做了具体介绍，我能力有限，还在研究。