质数(素数)的几种判断方法

2024-06-12 17:28

本文主要是介绍质数(素数)的几种判断方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

判断一个数是否为质数/合数是在数据处理中经常遇到的问题,如何解决这个问题,作者总结了如下几种算法。

质数的定义:

一个数如果除了1 和 其本身外,不能被其它数整除,就称这个数为质数(或素数)。

合数的定义:

一个数除了1和其本身外,还可以被其它数整除,那么就称这个数为合数。

  • 第一种:枚举法

这个方法的思想就是利用质数的定义来进行枚举判定。例如,判断数字N是否为质数,那么就逐一判断2~N-1 范围内的每一个数,是否可以被N整除,只要在这个范围内存在任意一个可以被N整除的数,就称N 为非质数。

//代码段1//10000内的所有质数的个数#include <stdio.h>
#define MAX_N 10000int is_prime(int n){for(int i = 2;i < n-1;i++){if(n % i == 0) return 0;}return 1;
}
int main(){int count = 0;for(int i = 2;i <= MAX_N;i++){if(is_prime(i)) ++count ;}printf("num is %d\n",count);return 0;
}

运行结果:

 

在10000以内,存在1229个质数,运行这段枚举代码用了0.21秒。 

枚举法分析:

优点:通过定义去判断,代码实现思路易于理解;

缺点:如果数据范围较大,即N值较大,在2~N-1 范围内逐一枚举,判断枚举值是否可以被N值整除,效率较低;

  • 第二种 优化枚举法

第一种方法的缺点显而易见,在进行枚举判断时的枚举范围是2~N-1, 缩小枚举范围就是优化方向。

我们知道,如果一个数N是合数,那么一定存在这样的关系:N = a*b (a和b 均不等于1 或者N本身) ,且因为存在 N = \sqrt{N} * \sqrt{N};所以,a 一定大于或等于 \sqrt{N}, 而b一定小于或等于\sqrt{N},不存在a和b同时大于或同时小于\sqrt{N}的情况。因此,枚举范围可以修改为2~\sqrt{N}, 因为,如果N是合数,那么在这个范围内必然存在一个它的因子。

//代码段2//10000内所有质数的总个数#include <stdio.h>
#include <math.h>#define MAX_N 10000int is_prime(int n){for(int i = 2,I = sqrt(n);i<= I;i++){if(n % i == 0) return 0;}return 1;
}int main(){int count = 0;for(int i = 2;i <= MAX_N;i++){if(is_prime(i)) ++count;}printf("num is %d\n",count);return 0;
}

运行结果:

将枚举范围由2~N-1 缩小到2~\sqrt{N} 后,运行时间由0.21缩短到0.002秒。

优缺点分析:

优点:通过缩小枚举范围,运行时间得到了显著提成;

缺点:时间复杂度依然是0(n*n)

小技巧:

在下述代码段中,如果数据规模是100000, 那么采用优化前的“代码段A”,程序的运行时间为0.25秒,如果采用优化后的“代码段B”,程序的运行时间为0.11秒,这是因为函数sqrt在代码段A中被调用了sqrt(n)次,执行了sqrt(n)  次的函数入栈出栈操作,但是在代码段B,sqrt函数只执行了一次。

//代码段3//优化前,代码段A:
int is_prime(int n){for(int i = 2; i<= sqrt(n);i++){if(n % i == 0) return 0;}return 1;
}//优化后,代码段B:
int is_prime(int n){for(int i = 2,I = sqrt(n);i<= I;i++){if(n % i == 0) return 0;}return 1;
}
  • 第三种 素筛法

素筛法是通过逐步排除合数来识别素数的一种数学算法。

总体思想

用素数去标记掉所有不是素数的数字,如果i是素数,那么所有i 的整数倍就不是素数。

代码实现思路

1. 构建一个额外的数据存储空间  int prime[N];

2. 用pirme[i] 来标记i是否为合数;

3. 第一次知道2 是素数,则将2的倍数都标记为1;

4. 向后找到第一个没有被标记的数字i;

5.将i的倍数全部标记为合数;

6. 重复4-5步,直到标记为你范围内的所有数字;

//代码段4#include <stdio.h>#define MAX_N 100
int prime[MAX_N+5] = {0};
void init_prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i] == 0){for(int j = 2, I = MAX_N/i; j <= I; j++){ //如果运行的这个行,表示i为质数;prime[j*i] = 1; // 将i的整数倍的值,都标记} }}return;
}
int main(){init_priem(); int cnt = 0; //用于计数,统计0~MAX_N 范围内有有多少个质数;for(int i = 2;i <= MAX_N;i++){if(prime[i] == 0) ++cnt;}printf("num is %d\n",cnt);return 0;
}

素筛法优化 之一

在代码段4 的init_prime() 函数中存在多层缩紧,为了提高代码的可读性,采用名为“对偶逻辑”

的编程技巧,所谓“对偶逻辑”就是对立的逻辑。

//代码段5
void init_prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i]) continue;for(int j = 2, I = MAX_N/i; j <= I; j++){ prime[i*j] = 1;}}return;
}

素筛法优化 之二

当前的init_prime() 函数已经做到了对数据范围内的所有数值进行了是否为质数的判断,如果i为质数,则prime[i] 等于0, 如果i为合数,则pirme[i] 为1.

是否可以将筛查出的质数保存到一个数据结构中?当然可以。

思路1: 申请一个数组, int primeValue[MAX_N+5] = {0}; 则 primeValue[0] = 2; primeValue[1] = 3;primeValue[2] = 5; ... 但是这么做增加了内存空间的开销;

思路2: 不额外的申请内存 ,只使用  int prime[MAX_N+5]

// 代码段6
#include <stdio.h>#define MAX_N 100000int prime[MAX_N+5] = {0};void init_Prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i]) continue;prime[++Prime[0]] = i; // 如果执行到这一行,说明i为质数,从prime[1] 开始依次存放找到的质数;++Prime[0] 说明每找到一个质数,prime[0]的值加1,当函数执行完毕,prime[0]代表质数的总个数for(int j = 2,I =MAX_N/i; j<=I; j++){prime[i*j] = 1;}}
}int main(){init_prime();for(int i = 1;i <= prime[0];i++){printf("%d ", prime[i]);if(i % 10 == 0) printf("\n"); // 一行打印10个数据;}return 0;
}

素筛法应用举例

例题1: 求出一个范围内(假设20)所有数字的最小素因子

解析:一个质数 N , 它只有1和它本身两个因子,因此它只存在一个因式 N = 1*N, 又因为1为非质数,所以质数N的最小素因子就是其本身。

编程思路:利用素筛法

#include <stdio.h>
#define MAX_N 20int prime[MAX_N+5] = {0}; //存放对应数据的素因子;void init_prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i]) continue;prime[i] = i; //i为质数,最小素因子即为i本身for(int j = 2, I <= MAX_N/i; j<=I; j++){if(prime[i*j]) continue; //如果已经被标记过,说明存储了最小素因子;prime[i*j] = i;}}return;
}int main(){init_prime();for(int i = 2;i<= MAX_N;i++){printf("min[%d] = %d\n",i, prime[i]);}return 0;
}

运行结果:

例题1: 求出一个范围内(假设20)所有数字的最大素因子 

解析:例如 数据 20,它的因式可有表示为:2*10; 5*4; 所以它的最大素因子就是5;

#include <stdio.h>#define MAX_N 20
int prime[MAX_N] = {0};void init_prime(){for(int i  = 2; i <= MAX_N;i++){if(prime[i]) continue;prime[i] = i;for(int j = 2, I=MAX_N/i; j<=I; j++){prime[i*j] = i;}}}int main(){init_prime();for(int i = 2;i <= MAX_N;i++){printf("MAX(%d) = %d\n",i, prime[i]);}return 0;}

运行结果:

  • 第四种 线性筛算法

在上述素筛法的实现过程中,存在数据被多次标记的情况。

例如:合数6被标记了几次?当前质数为2时,标记2的倍数,6被标记了一次,当执行到质数3时,6作为3的倍数,又被标记了一次,所以,6被标记了2次。

通过分析,一个存在m个质数因子的合数,将被标记m次 (参考代码6的init_prime() 函数)。

例如:30 被标记了几次?30存在的质数因子为:2,3,5,所以,它将被标记3次。

为了解决合数被重复标记的问题,可以采用线性筛算法。

算法思想

1. 标记一个范围内的数字是否为合数,没有被标记的则为素数。

2. 算法的空间复杂度为O(N), 时间复杂度为O(N)

3. 一个合数N的n个因子中,最小的那个素数因子p,被称为最小素因子,线性筛算法的思想就是用满足等式N=m*p的中的m去标记N。同样以30为例,它的所有因式如下:

因式1:   1*30

因式2:   2*15

因式3:   3*10

因式4:   5*6

因式5:   6*5

因式6:  10*3

因式7:  15*2

因式8:  30*1

由于因式1和因式8是由 数字1和它本身构成,不予考虑。如果使用素筛法时,参见代码段6的init_prime() 函数,当i = 2,3,5时,30都会被标记一次,但是线筛法的思想是,找到最小素因子2所对应的因子15,用15*2 标记出30,因为15是30的最大因子,是30的对后一个因式,是i值循环加加的过程中,最后一次得到30的机会,用来标记30,30的有且一次的标记机会。

所以,N和m有如下性质:

1. N中最小的素数为p

2. N可以表示成P*m

3. p一定小于等于m中最小的素因子(即:m不是p的整数倍,如果m是p的整数倍,那么p就不是N的最小素因子)

4. 利用M*{p}' (所有不大于m中最小素数的集合)标记N1,N2,N2....

代码实现

#include <stdio.h>#define MAX_N 100int prime[MAX_N+5] = {0};void init_prime(){for(int i = 2;i <= MAX_N;i++){  // i值为mif(!prime[i]) prime[++prime[0]] = i;for(int j = 1;j <= prime[0]; j++){if(prime[j] *i > MAX_N) break;prime[prime[j]*i] = 1;  // 通过m*p 找到对应的N if(i % prime[j] == 0) break;}}return 0;
}int main(){init_prime();for(int i = 1;i <= prime[0]; i++){printf("%d\n",prime[i]);}return 0;
}

线性筛算法应用:

题目: 所有小于10的质数的和是2+3+5+7 = 17。求所有小于两百万的质数的和。

解析:

第一步:求出200万内的质数

第二步:求出质数和

//利用线性筛算法求200万内的质数和#include <stdio.h>#define MAX_N 2000000int prime[MAX_N+5] = {0}void init_prime(){for(int i = 0;i <= MAX_N; i++){if(!prime[i]) prime[++prime[0]] = i;for(int j = 1; j < prime[0];j++){if(prime[j]*i > MAX_N) break;prime[prime[j]*i] = 1;if(i % prime[j] == 0) break;}}return;
}init main(){long long sum = 0;for(int i = 1; i <= prime[0]; i++){sum += prime[i];}printf("sum = %lld\n",sum);return 0;
}

这篇关于质数(素数)的几种判断方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1054863

相关文章

Windows 上如果忘记了 MySQL 密码 重置密码的两种方法

《Windows上如果忘记了MySQL密码重置密码的两种方法》:本文主要介绍Windows上如果忘记了MySQL密码重置密码的两种方法,本文通过两种方法结合实例代码给大家介绍的非常详细,感... 目录方法 1:以跳过权限验证模式启动 mysql 并重置密码方法 2:使用 my.ini 文件的临时配置在 Wi

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

最详细安装 PostgreSQL方法及常见问题解决

《最详细安装PostgreSQL方法及常见问题解决》:本文主要介绍最详细安装PostgreSQL方法及常见问题解决,介绍了在Windows系统上安装PostgreSQL及Linux系统上安装Po... 目录一、在 Windows 系统上安装 PostgreSQL1. 下载 PostgreSQL 安装包2.

SQL中redo log 刷⼊磁盘的常见方法

《SQL中redolog刷⼊磁盘的常见方法》本文主要介绍了SQL中redolog刷⼊磁盘的常见方法,将redolog刷入磁盘的方法确保了数据的持久性和一致性,下面就来具体介绍一下,感兴趣的可以了解... 目录Redo Log 刷入磁盘的方法Redo Log 刷入磁盘的过程代码示例(伪代码)在数据库系统中,r

JAVA保证HashMap线程安全的几种方式

《JAVA保证HashMap线程安全的几种方式》HashMap是线程不安全的,这意味着如果多个线程并发地访问和修改同一个HashMap实例,可能会导致数据不一致和其他线程安全问题,本文主要介绍了JAV... 目录1. 使用 Collections.synchronizedMap2. 使用 Concurren

Python如何精准判断某个进程是否在运行

《Python如何精准判断某个进程是否在运行》这篇文章主要为大家详细介绍了Python如何精准判断某个进程是否在运行,本文为大家整理了3种方法并进行了对比,有需要的小伙伴可以跟随小编一起学习一下... 目录一、为什么需要判断进程是否存在二、方法1:用psutil库(推荐)三、方法2:用os.system调用

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Java中Switch Case多个条件处理方法举例

《Java中SwitchCase多个条件处理方法举例》Java中switch语句用于根据变量值执行不同代码块,适用于多个条件的处理,:本文主要介绍Java中SwitchCase多个条件处理的相... 目录前言基本语法处理多个条件示例1:合并相同代码的多个case示例2:通过字符串合并多个case进阶用法使用

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

html5的响应式布局的方法示例详解

《html5的响应式布局的方法示例详解》:本文主要介绍了HTML5中使用媒体查询和Flexbox进行响应式布局的方法,简要介绍了CSSGrid布局的基础知识和如何实现自动换行的网格布局,详细内容请阅读本文,希望能对你有所帮助... 一 使用媒体查询响应式布局        使用的参数@media这是常用的