线性基(处理集合异或的强力工具)

2024-01-29 12:38

本文主要是介绍线性基(处理集合异或的强力工具),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

看了好多篇关于线性基的博客,只是说明了怎么求线性基,但是大都没有说明为什么这样求线性基。


定义:

有一个集合 S  = {a1,a2...,an},T的满足下面条件的一个最小子集A = {a1,a2,....,ak}

A的所有子集的异或和的值域与T的所有子集的异或和的值域相同,那么A就是T的线性基。


预备知识:

1、张成:S的所有子集,其异或和的所有可能的结果组成的集合,为S的张成,记作span(S)。


2、线性相关:对于一个集合S,如果存在一个元素Sj,去除这个元素后得到的集合S'的张成span(S')中包含Sj,即SJspan(S'),则称集合S是线性相关的。如果不存在这样的Sj,那么集合S就是线性无关的。


3、线性基:有了上面两个名词,我们还可以这样定义线性基。

    (1)A ⊆ span(S)

    (2)A是线性无关的

则集合A是集合S的线性基。


性质:

1、A是一个集合的线性基,那么它的任何真子集都不可能是线性基;

2、S中所有的向量都可以按唯一的方式表达为 A 中元素的线性组合(也就是异或和)。


构造:

我们令集合中的数为a1,a2,....,an,b[ ]数组用来存储线性基里面的数。(下面的二进制的位数下标从0开始)

第一种情况:找到ai的最高位,假如是第j位,如果b[j]还没有数,即b[j] = 0,那么现在b数组中的数的张成肯定不包含ai,那么我们就可以b[j] = a[i],然后利用已经在线性基里的最高位小于j的把b[j]二进制中的1给消掉,具体就是 b[j] ^= b[k] ( k < j && b[j]的第k位为1 && b[k] != 0) ,然后用同样的方法把大于j的也消掉。

第二种情况:找到ai的最高位,假如是第j位,如果b[j]已经有数,就判断现在线性基的张成span(a1,a2...,ai-1)包不包含ai,如果包含,那么ai就没有必要加进线性基。怎么判断呢,我们如果ai的第j位为1且b[j] != 0,那么我们就把ai的值异或上b[j],依次往后判断,直到ai当前的最高位对应的b[j] == 0,就可以把ai加入线性基,执行上面第一种情况的操作,或者ai为0,就丢掉ai。

代码如下:

void create()
{for(int i=1;i<=n;i++){for(int j=60;j>=0;j--){if((1LL<<j)&a[i]){if(b[j] != 0)a[i] ^= b[j];else{b[j] = a[i];for(int k=j-1;k>=0;k--)if(((1LL<<k)&b[j]) && b[k])b[j] ^= b[k];for(int k=j+1;k<=60;k++)if(((1LL<<j)&b[k]))b[k] ^= b[j];break;}}}}
}

这段代码是维护一个对角矩阵,加入一行之后,先用下面的行消自己,然后再用自己去消上面的行。

我们来演示一下这个过程:

加入n = 5,a = {7,1,3,4,5}

初始矩阵: 

                            0 0 0 

                            0 0 0

                            0 0 0

插入7之后:

                            1 1 1

                            0 0 0 

                            0 0 0 

插入3之后,为了维护对角矩阵,把7的低位消掉:

                            1 0 0

                            0 1 1 

                            0 0 0

插入1之后,把1上面的行的低位都消掉:

                            1 0 0 

                            0 1 0

                            0 0 1

然后就发现后面那几个数都已经包含在b数组的张成里了,加不进去了。


上述过程是把线性基维护成一个对角矩阵,其实我们还有一种代码量比较少的线性基的构造方法,就是只把矩阵消成上三角矩阵,这样的话同样可以知道哪一位存在于线性基内。


线性基的操作:

我们把线性基封装成一个结构体,这样使用起来方便一点:

struct LineBasis
{LL b[66];LL p[66];int cnt;int max_b = 62;LineBasis(){memset(b,0,sizeof(b));memset(p,0,sizeof(p));cnt = 0;}
}

这里的b数组就是用于存线性基里的数,这个cnt是记录线性基里面有多少个数。

那么这个cnt有什么作用呢,2的cnt次幂就是这个线性基所有子集异或和能构成的不同元素的个数(这里包括零)。

max_b是最大那个数二进制的长度

下面介绍他的各个函数:

1、插入

上面虽然展示了一种线性基的构造方法,那个方法可以提现出线性基的性质,但是下面我们用它比较方便的写法:

    bool Insert(LL val){for(int i=max_b;i>=0;i--){if((1LL<<i)&val){if(b[i] == 0){b[i] = val;break;}val ^= b[i];}}if(val > 0)cnt++;return val > 0;}



2、合并:

把一个线性基里的元素一个一个的Insert到另一个里面,就完成了合并。

    LineBasis Merge(LineBasis n1,LineBasis n2){LineBasis ret = n1;for(int i=0;i<=max_b;i++)if(n2.b[i])ret.Insert(n2.b[i]);return ret;}


线性基的用途:

1、求一组数所有组合能构成的不同异或和的个数:

求出这组数的线性基,线性基里数的个数为cnt,答案就为2的cnt次幂

hihocoder1723 子树统计


2、存在性:

查询x是否存在于异或集合中,跟上面构造方法的思想相似,从高位到低位扫描x位1的二进制位,扫到第i位时,x ^= b[i],如果最后x变为0,则存在,否则不存在。


3、最大值:

求异或集合中的最大值

如果消成对角矩阵的话,直接把线性基中的所有元素异或起来即可。但是对于上三角矩阵,异或之前判断一下是否能变大。

还可以求一个数x与集合中某些数异或的最大值,只用把初值设为x就行了,单纯求最大值时最初始值设为0.

    LL QueryMax(LL x){LL ans = x;for(int i=max_b;i>=0;i--)if((ans^b[i]) > ans)ans ^= b[i];return ans;}


4、最小值:

最小值就是最低位上的线性基。

    LL QueryMin(){for(int i=0;i<=max_b;i++)if(b[i])return b[i];return 0;}


5、k小值

这时候用构造出的上三角矩阵就不能解决这个问题了,我们要把上三角矩阵变换成对角矩阵,然后再把不为零的都按顺序拿出来。这时候矩阵已经变成对角矩阵(至少是行最简形矩阵),我们异或上某一行的值,答案就会变大一点。我们可以想象,从一个数组 a = {8,4,2,1}中选出几个,求能组成第k小的值是多少,利用二进制的性质,如果k的二进制第i位为1,我们就加上数组里第i大的数。这里的异或上一个值也会变大一点,所以可以用同样的思想。具体看下面代码

    void rebuild(){for(int i=max_b;i>=0;i--)for(int j=i-1;j>=0;j--)if(b[i]&(1LL<<j))b[i] ^= b[j];cnt = 0;for(int i=0;i<=max_b;i++)if(b[i])p[cnt++] = b[i];}LL kthquery(LL k){LL ans = 0;if(k>=(1LL<<cnt))return -1;for(int i=max_b;i>=0;i--)if(k&(1LL<<i))ans ^= p[i];return ans;}



总的模板:

#include<vector>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#define LL long longusing namespace std;struct LineBasis
{LL b[66];LL p[66];int cnt;int max_b = 62;LineBasis(){memset(b,0,sizeof(b));memset(p,0,sizeof(p));cnt = 0;}bool Insert(LL val){for(int i=max_b;i>=0;i--){if((1LL<<i)&val){if(b[i] == 0){b[i] = val;break;}val ^= b[i];}}if(val > 0)cnt++;return val > 0;}LineBasis Merge(LineBasis n1,LineBasis n2){LineBasis ret = n1;for(int i=0;i<=max_b;i++)if(n2.b[i])ret.Insert(n2.b[i]);return ret;}LL QueryMax(LL x){LL ans = x;for(int i=max_b;i>=0;i--)if((ans^b[i]) > ans)ans ^= b[i];return ans;}LL QueryMin(){for(int i=0;i<=max_b;i++)if(b[i])return b[i];return 0;}void rebuild(){for(int i=max_b;i>=0;i--)for(int j=i-1;j>=0;j--)if(b[i]&(1LL<<j))b[i] ^= b[j];cnt = 0;for(int i=0;i<=max_b;i++)if(b[i])p[cnt++] = b[i];}LL kthquery(LL k){LL ans = 0;if(k>=(1LL<<cnt))return -1;for(int i=max_b;i>=0;i--)if(k&(1LL<<i))ans ^= p[i];return ans;}
};int a[11000];
int main(void)
{int n,i,j;LineBasis s;scanf("%d",&n);for(i=1;i<=n;i++){scanf("%d",&a[i]);s.Insert(a[i]);}return 0;
}/*
5
7 1 4 3 5
*/



如有错误,欢迎指出。

这篇关于线性基(处理集合异或的强力工具)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/656925

相关文章

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

uva 11178 计算集合模板题

题意: 求三角形行三个角三等分点射线交出的内三角形坐标。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vector>#include <

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

超强的截图工具:PixPin

你是否还在为寻找一款功能强大、操作简便的截图工具而烦恼?市面上那么多工具,常常让人无从选择。今天,想给大家安利一款神器——PixPin,一款真正解放双手的截图工具。 想象一下,你只需要按下快捷键就能轻松完成多种截图任务,还能快速编辑、标注甚至保存多种格式的图片。这款工具能满足这些需求吗? PixPin不仅支持全屏、窗口、区域截图等基础功能,它还可以进行延时截图,让你捕捉到每个关键画面。不仅如此

Thymeleaf:生成静态文件及异常处理java.lang.NoClassDefFoundError: ognl/PropertyAccessor

我们需要引入包: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId></dependency><dependency><groupId>org.springframework</groupId><artifactId>sp

jenkins 插件执行shell命令时,提示“Command not found”处理方法

首先提示找不到“Command not found,可能我们第一反应是查看目标机器是否已支持该命令,不过如果相信能找到这里来的朋友估计遇到的跟我一样,其实目标机器是没有问题的通过一些远程工具执行shell命令是可以执行。奇怪的就是通过jenkinsSSH插件无法执行,经一番折腾各种搜索发现是jenkins没有加载/etc/profile导致。 【解决办法】: 需要在jenkins调用shell脚

PR曲线——一个更敏感的性能评估工具

在不均衡数据集的情况下,精确率-召回率(Precision-Recall, PR)曲线是一种非常有用的工具,因为它提供了比传统的ROC曲线更准确的性能评估。以下是PR曲线在不均衡数据情况下的一些作用: 关注少数类:在不均衡数据集中,少数类的样本数量远少于多数类。PR曲线通过关注少数类(通常是正类)的性能来弥补这一点,因为它直接评估模型在识别正类方面的能力。 精确率与召回率的平衡:精确率(Pr