质数（素数）的几种判断方法

本文主要是介绍质数（素数）的几种判断方法，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

判断一个数是否为质数/合数是在数据处理中经常遇到的问题，如何解决这个问题，作者总结了如下几种算法。

质数的定义：

一个数如果除了1 和其本身外，不能被其它数整除，就称这个数为质数（或素数）。

合数的定义：

一个数除了1和其本身外，还可以被其它数整除，那么就称这个数为合数。

第一种：枚举法

这个方法的思想就是利用质数的定义来进行枚举判定。例如，判断数字N是否为质数，那么就逐一判断2～N-1 范围内的每一个数，是否可以被N整除，只要在这个范围内存在任意一个可以被N整除的数，就称N 为非质数。

//代码段1//10000内的所有质数的个数#include <stdio.h>
#define MAX_N 10000int is_prime(int n){for(int i = 2;i < n-1;i++){if(n % i == 0) return 0;}return 1;
}
int main(){int count = 0;for(int i = 2;i <= MAX_N;i++){if(is_prime(i)) ++count ;}printf("num is %d\n",count);return 0;
}

运行结果：

在10000以内，存在1229个质数，运行这段枚举代码用了0.21秒。

枚举法分析：

优点：通过定义去判断，代码实现思路易于理解；

缺点：如果数据范围较大，即N值较大，在2～N-1 范围内逐一枚举，判断枚举值是否可以被N值整除，效率较低；

第二种优化枚举法

第一种方法的缺点显而易见，在进行枚举判断时的枚举范围是2～N-1，缩小枚举范围就是优化方向。

我们知道，如果一个数N是合数，那么一定存在这样的关系：N = a*b （a和b 均不等于1 或者N本身），且因为存在 N = $\sqrt{N}$ * $\sqrt{N}$ ；所以，a 一定大于或等于 $\sqrt{N}$ ，而b一定小于或等于 $\sqrt{N}$ ，不存在a和b同时大于或同时小于 $\sqrt{N}$ 的情况。因此，枚举范围可以修改为2～ $\sqrt{N}$ ，因为，如果N是合数，那么在这个范围内必然存在一个它的因子。

//代码段2//10000内所有质数的总个数#include <stdio.h>
#include <math.h>#define MAX_N 10000int is_prime(int n){for(int i = 2，I = sqrt(n);i<= I;i++){if(n % i == 0) return 0;}return 1;
}int main(){int count = 0;for(int i = 2;i <= MAX_N;i++){if(is_prime(i)) ++count;}printf("num is %d\n",count);return 0;
}

运行结果：

将枚举范围由2～N-1 缩小到2～ $\sqrt{N}$ 后，运行时间由0.21缩短到0.002秒。

优缺点分析：

优点：通过缩小枚举范围，运行时间得到了显著提成；

缺点：时间复杂度依然是0（n*n）

小技巧：

在下述代码段中，如果数据规模是100000，那么采用优化前的“代码段A”，程序的运行时间为0.25秒，如果采用优化后的“代码段B”，程序的运行时间为0.11秒，这是因为函数sqrt在代码段A中被调用了sqrt(n)次，执行了sqrt(n) 次的函数入栈出栈操作，但是在代码段B，sqrt函数只执行了一次。

//代码段3//优化前，代码段A：
int is_prime(int n){for(int i = 2; i<= sqrt(n);i++){if(n % i == 0) return 0;}return 1;
}//优化后，代码段B：
int is_prime(int n){for(int i = 2，I = sqrt(n);i<= I;i++){if(n % i == 0) return 0;}return 1;
}

第三种素筛法

素筛法是通过逐步排除合数来识别素数的一种数学算法。

总体思想：

用素数去标记掉所有不是素数的数字，如果i是素数，那么所有i 的整数倍就不是素数。

代码实现思路：

1. 构建一个额外的数据存储空间 int prime[N]；

2. 用pirme[i] 来标记i是否为合数；

3. 第一次知道2 是素数，则将2的倍数都标记为1；

4. 向后找到第一个没有被标记的数字i；

5.将i的倍数全部标记为合数；

6. 重复4-5步，直到标记为你范围内的所有数字；

//代码段4#include <stdio.h>#define MAX_N 100
int prime[MAX_N+5] = {0};
void init_prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i] == 0){for(int j = 2, I = MAX_N/i; j <= I; j++){ //如果运行的这个行，表示i为质数；prime[j*i] = 1; // 将i的整数倍的值，都标记} }}return;
}
int main(){init_priem(); int cnt = 0; //用于计数，统计0～MAX_N 范围内有有多少个质数；for(int i = 2;i <= MAX_N;i++){if(prime[i] == 0) ++cnt;}printf("num is %d\n",cnt);return 0;
}

素筛法优化之一

在代码段4 的init_prime() 函数中存在多层缩紧，为了提高代码的可读性，采用名为“对偶逻辑”

的编程技巧，所谓“对偶逻辑”就是对立的逻辑。

//代码段5
void init_prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i]) continue;for(int j = 2, I = MAX_N/i; j <= I; j++){ prime[i*j] = 1;}}return;
}

素筛法优化之二

当前的init_prime() 函数已经做到了对数据范围内的所有数值进行了是否为质数的判断，如果i为质数，则prime[i] 等于0，如果i为合数，则pirme[i] 为1.

是否可以将筛查出的质数保存到一个数据结构中？当然可以。

思路1: 申请一个数组， int primeValue[MAX_N+5] = {0}; 则 primeValue[0] = 2; primeValue[1] = 3;primeValue[2] = 5; ... 但是这么做增加了内存空间的开销；

思路2: 不额外的申请内存，只使用 int prime[MAX_N+5]

// 代码段6
#include <stdio.h>#define MAX_N 100000int prime[MAX_N+5] = {0};void init_Prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i]) continue;prime[++Prime[0]] = i; // 如果执行到这一行，说明i为质数，从prime[1] 开始依次存放找到的质数；++Prime[0] 说明每找到一个质数，prime[0]的值加1，当函数执行完毕，prime[0]代表质数的总个数for(int j = 2,I =MAX_N/i; j<=I; j++){prime[i*j] = 1;}}
}int main(){init_prime();for(int i = 1;i <= prime[0];i++){printf("%d ", prime[i]);if(i % 10 == 0) printf("\n"); // 一行打印10个数据；}return 0;
}

素筛法应用举例

例题1: 求出一个范围内（假设20）所有数字的最小素因子

解析：一个质数 N , 它只有1和它本身两个因子，因此它只存在一个因式 N = 1*N，又因为1为非质数，所以质数N的最小素因子就是其本身。

编程思路：利用素筛法

#include <stdio.h>
#define MAX_N 20int prime[MAX_N+5] = {0}; //存放对应数据的素因子；void init_prime(){for(int i = 2;i <= MAX_N;i++){if(prime[i]) continue;prime[i] = i; //i为质数，最小素因子即为i本身for(int j = 2, I <= MAX_N/i; j<=I; j++){if(prime[i*j]) continue; //如果已经被标记过，说明存储了最小素因子；prime[i*j] = i;}}return;
}int main(){init_prime();for(int i = 2;i<= MAX_N;i++){printf("min[%d] = %d\n",i, prime[i]);}return 0;
}

运行结果：

例题1: 求出一个范围内（假设20）所有数字的最大素因子

解析：例如数据 20，它的因式可有表示为：2*10； 5*4；所以它的最大素因子就是5；

#include <stdio.h>#define MAX_N 20
int prime[MAX_N] = {0};void init_prime(){for(int i  = 2; i <= MAX_N;i++){if(prime[i]) continue;prime[i] = i;for(int j = 2, I=MAX_N/i; j<=I; j++){prime[i*j] = i;}}}int main(){init_prime();for(int i = 2;i <= MAX_N;i++){printf("MAX(%d) = %d\n",i, prime[i]);}return 0;}

运行结果：

第四种线性筛算法

在上述素筛法的实现过程中，存在数据被多次标记的情况。

例如：合数6被标记了几次？当前质数为2时，标记2的倍数，6被标记了一次，当执行到质数3时，6作为3的倍数，又被标记了一次，所以，6被标记了2次。

通过分析，一个存在m个质数因子的合数，将被标记m次（参考代码6的init_prime() 函数）。

例如：30 被标记了几次？30存在的质数因子为：2，3，5，所以，它将被标记3次。

为了解决合数被重复标记的问题，可以采用线性筛算法。

算法思想：

1. 标记一个范围内的数字是否为合数，没有被标记的则为素数。

2. 算法的空间复杂度为O(N), 时间复杂度为O(N)

3. 一个合数N的n个因子中，最小的那个素数因子p，被称为最小素因子，线性筛算法的思想就是用满足等式N=m*p的中的m去标记N。同样以30为例，它的所有因式如下：

~~因式1: 1*30~~

因式2: 2*15

因式3: 3*10

因式4: 5*6

因式5: 6*5

因式6: 10*3

因式7: 15*2

~~因式8: 30*1~~

由于因式1和因式8是由数字1和它本身构成，不予考虑。如果使用素筛法时，参见代码段6的init_prime() 函数，当i = 2，3，5时，30都会被标记一次，但是线筛法的思想是，找到最小素因子2所对应的因子15，用15*2 标记出30，因为15是30的最大因子，是30的对后一个因式，是i值循环加加的过程中，最后一次得到30的机会，用来标记30，30的有且一次的标记机会。

所以，N和m有如下性质：

1. N中最小的素数为p

2. N可以表示成P*m

3. p一定小于等于m中最小的素因子（即：m不是p的整数倍，如果m是p的整数倍，那么p就不是N的最小素因子）

4. 利用M* ${p}'$ （所有不大于m中最小素数的集合）标记N1，N2，N2....

代码实现

#include <stdio.h>#define MAX_N 100int prime[MAX_N+5] = {0};void init_prime(){for(int i = 2;i <= MAX_N;i++){  // i值为mif(!prime[i]) prime[++prime[0]] = i;for(int j = 1;j <= prime[0]; j++){if(prime[j] *i > MAX_N) break;prime[prime[j]*i] = 1;  // 通过m*p 找到对应的N if(i % prime[j] == 0) break;}}return 0;
}int main(){init_prime();for(int i = 1;i <= prime[0]; i++){printf("%d\n",prime[i]);}return 0;
}

线性筛算法应用：

题目：所有小于10的质数的和是2+3+5+7 = 17。求所有小于两百万的质数的和。

解析：

第一步：求出200万内的质数

第二步：求出质数和

//利用线性筛算法求200万内的质数和#include <stdio.h>#define MAX_N 2000000int prime[MAX_N+5] = {0}void init_prime(){for(int i = 0;i <= MAX_N; i++){if(!prime[i]) prime[++prime[0]] = i;for(int j = 1; j < prime[0];j++){if(prime[j]*i > MAX_N) break;prime[prime[j]*i] = 1;if(i % prime[j] == 0) break;}}return;
}init main(){long long sum = 0;for(int i = 1; i <= prime[0]; i++){sum += prime[i];}printf("sum = %lld\n",sum);return 0;
}