STL系列十一 随机三趣题——随机重排,文件中随机取一行,生成N个随机数

2024-04-23 01:58

本文主要是介绍STL系列十一 随机三趣题——随机重排,文件中随机取一行,生成N个随机数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

8人阅读 评论(0) 收藏 举报

目录(?)[+]

本文将介绍三个有趣的随机问题,分别是随机重新排列、从文件中随机取一行数据、生成N个随机数。

 

一.随机重新排列

将一个序列打乱并对其进行随机的重新排列,关键在于每种序列的被选择概率要一样,不然有失“公平”。现在让我们来寻找如何保证每种序列被选择的概率一样大的算法。

首先假设这个数组只有二个元素,设数组a{1, 2},显然这个数组只有二种可能的排列,要么是{12}要么是{21}。很容易想到一种方法——只要第二个元素有50%的概率与第一个元素交换即可。用代码表现下:

if (rand() % 2 == 0)

      swap(a[0], a[1])

由于rand() % 2的结果要么为0,要么为1,且各占50%的概率。因此swap(a[0],a[1])的执行概率也是50%,如果执行了,结果会是{21}。没有执行,结果会是{12}。所以这样两种排列出现的可能均为50%

 

接下来再假充这个数组有三个元素设数组a{1, 23},这个数组有六种可能的排列,要么是{123}{132}{213}{231}{312}{321}。这么多的排列看起来好象有点复杂,不知道从何下手。其实结合上面的分析,我们可以这样考虑:

1.先调整前二个元素即{1, 23}先生成{123}{213}

2.然后对{123},第三个元素以1/3的概率与第一,第二,第三个元素进行交换就可以等概率的得到{321}{132}{123}

3.同理对{213},可以等概率的得到{312}{231}{213}

根据贝叶斯公式,不难计算出由这些排列出现的可能性都是1/2 * 1/3 = 1/6。完全符合每种序列的被选择概率相同的要求。

 

这样随机重新排列的算法就找到了,下面给出示意代码:

[cpp] view plain copy
  1. //随机重新排列  
  2. //参照STL中的random_shuffle  
  3. #include <stdio.h>  
  4. #include <stdlib.h>  
  5. #include <time.h>  
  6. inline void Swap(int *a, int *b)  
  7. {  
  8.     int c = *a;  
  9.     *a = *b;  
  10.     *b = c;  
  11. }  
  12. //随机重新排列函数  
  13. void Random_shuffle(int a[], int n)  
  14. {  
  15.     srand(time(NULL));  
  16.     for (int i = 1; i < n; i++)  
  17.         Swap(&a[i], &a[rand() % (i + 1)]);  
  18. }  
  19. void PrintfIntArray(int a[], int n)  
  20. {  
  21.     for (int i = 0; i < n; i++)  
  22.         printf("%d ", a[i]);  
  23.     putchar('\n');  
  24. }  
  25. int main()  
  26. {  
  27.     printf("           随机重新排列 \n");  
  28.     printf("--- by MoreWindows( http://blog.csdn.net/MoreWindows )  ---\n\n");  
  29.   
  30.     const int MAXN = 8;  
  31.     int a[MAXN] = {1, 2, 3, 4, 5, 6, 7, 8};  
  32.   
  33.     printf("原数组:\n");  
  34.     PrintfIntArray(a, MAXN);  
  35.   
  36.     Random_shuffle(a, MAXN);  
  37.   
  38.     printf("随机重新排列后:\n");  
  39.     PrintfIntArray(a, MAXN);  
  40.     return 0;  
  41. }  

运行结果如下:

有兴趣的童鞋可以用STL中的random_shuffle()来改写上面的程序,相信知道其实现原理后会对random_shuffle()有更深的认识。

另外,这种按顺序先后来交换元素得到新排列的方法与生成全排列非常类似,可以参考《STL系列之十 全排列(百度迅雷笔试题)》然后对比下两种方法在思路上相似之处。

 

二.从文件中随机取一行数据

如果先统计文件有多少行,再根据rand() % 行数选择对应行也是可以行的,但效率显然会有点低了。有没有一种方法可以只遍历文件一次了?请看代码:

[cpp] view plain copy
  1. //从文件中取机选取一行  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4. #include <time.h>  
  5. int main()  
  6. {  
  7.     printf("           从文件中取机选取一行 \n");  
  8.     printf("--- by MoreWindows( http://blog.csdn.net/MoreWindows )  ---\n\n");  
  9.   
  10.     int i, num, nChooseNum;  
  11.     const char strFileName[] = "in.txt";  
  12.       
  13.     freopen(strFileName, "r", stdin);  
  14.     srand(time(NULL));  
  15.     i = 1;  
  16.     while (scanf("%d", &num) != EOF)  
  17.     {  
  18.         if (rand() % i == 0)  
  19.             nChooseNum = num;  
  20.         i++;  
  21.     }  
  22.     printf("从文件中选取出: %d\n", nChooseNum);  
  23.     return 0;  
  24. }  

运行结果如下(in.txt中为09,每个数字占一行):

对代码进行下讲解,以三行数据为例,首先对文本的第一行,rand() % 1,结果必然为0。所以第一行已被选中了,然后对第二行,rand()%2,结果要么为0,要么为1。故第二行有 50的可能性被选中,然后对第三行,rand()%3,显然被选中的概率为1/3。故有:

选中第一行的概率为1 * 1/2 * 2/3 = 1/3

选中第二行的概率为1/2 * 2/3 = 1/3

选中第三行的概率为1/3

故每一行被选中是等概率的。

 

三.生成N个随机数

这个有很多方法,常见方法用set记录已经生成的数据,然后判断set的大小是否符合要求。代码如下所示:

[cpp] view plain copy
  1. //生成n个指定范围的随机数  
  2. #include <stdio.h>  
  3. #include <time.h>  
  4. #include <set>  
  5. //生成n个[s, e)范围的数  
  6. void GetRandNumberInRange(int *a, int n, int s, int e)  
  7. {  
  8.     int   i, j;  
  9.     std::set<int>  m;  
  10.     std::set<int>::iterator setpos;  
  11.       
  12.     srand(time(NULL));    
  13.     while (m.size() < n)  
  14.     {  
  15.         j = rand() % (e - s) + s;  
  16.         m.insert(j);  
  17.     }  
  18.       
  19.     i = 0;  
  20.     for (setpos = m.begin(); setpos != m.end(); setpos++)  
  21.         a[i++] = *setpos;  
  22. }  
  23. void PrintfIntArray(int a[], int n)  
  24. {  
  25.     for (int i = 0; i < n; i++)  
  26.         printf("%d ", a[i]);  
  27.     putchar('\n');  
  28. }  
  29. int main()  
  30. {  
  31.     const int NMAX = 20;  
  32.     const int NUMSTART = 1;  
  33.     const int NUMEND = 100;  
  34.   
  35.     printf("           生成%d个%d到%d之间的数 \n", NMAX, NUMSTART, NUMEND);  
  36.     printf("--- by MoreWindows( http://blog.csdn.net/MoreWindows )  ---\n\n");    
  37.   
  38.     int    a[NMAX];  
  39.       
  40.     GetRandNumberInRange(a, NMAX, NUMSTART, NUMEND + 1);  
  41.     PrintfIntArray(a, NMAX);  
  42.     return 0;  
  43. }  

运行结果如下:

这种方法会导致调用随机函数次数过多,从而效率低下。可以采用一种改进的方法,如要生成3110之间的数,取10-3=7,因此可以先t=rand()%7,保存t,然后再t=rand()%8,如果t这个数已经存在就取8保存,再t=rand()%9,同样如果t这个数已经存在就取9保存。这样只会调用3次随机函数。当然这种方法不能完全保证每个数字被选择概率相同,算是牺牲“公平”来保证效率吧。

生成N个随机数的改进方法代码如下:

[cpp] view plain copy
  1. //生成n个指定范围的随机数  
  2. #include <set>  
  3. #include <cstdio>  
  4. #include <cstdlib>  
  5. #include <ctime>  
  6. //在[s, e)区间上随机取n个数并存放到a[]中  
  7. void GetRandomNum(int *a, int n, int s, int e)  
  8. {  
  9.     std::set<int> set_a;  
  10.     srand(time(NULL));  
  11.     for (int i = e - n; i < e; i++)  
  12.     {  
  13.         int num = (rand() % (i - s)) + s;  
  14.         if (set_a.find(num) == set_a.end())  
  15.             set_a.insert(num);  
  16.         else  
  17.             set_a.insert(i);  
  18.     }  
  19.     i = 0;  
  20.     std::set<int>::iterator pos;  
  21.     for (pos = set_a.begin(); pos != set_a.end(); pos++)  
  22.         a[i++] = *pos;  
  23. }  
  24. void PrintfIntArray(int a[], int n)  
  25. {  
  26.     for (int i = 0; i < n; i++)  
  27.         printf("%d ", a[i]);  
  28.     putchar('\n');  
  29. }  
  30. int main()  
  31. {  
  32.     const int NMAX = 20;  
  33.     const int NUMSTART = 1;  
  34.     const int NUMEND = 100;  
  35.       
  36.     printf("           生成%d个%d到%d之间的数 改进版\n", NMAX, NUMSTART, NUMEND);  
  37.     printf("--- by MoreWindows( http://blog.csdn.net/MoreWindows )  ---\n\n");   
  38.     int a[NMAX];  
  39.       
  40.     GetRandomNum(a, NMAX, NUMSTART, NUMEND + 1);  
  41.     PrintfIntArray(a, NMAX);  
  42.     return 0;  
  43. }  

运行结果如下:

 

有关随机的趣味题就介绍到这里,有任何问题欢迎和我交流,直接留言或发送邮件均可。邮箱:morewindows@126.com

 

下一篇《STL系列十二链表排序的6次改进(对《STL源码剖析》作个补充)》将会对STL中的链表排序进行详细讲解,如果看过《STL源码剖析》书中142页的链表排序代码将会更有收获。更多内容,请继续关注MoreWindows

这篇关于STL系列十一 随机三趣题——随机重排,文件中随机取一行,生成N个随机数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/927473

相关文章

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

C++ STL-string类底层实现过程

《C++STL-string类底层实现过程》本文实现了一个简易的string类,涵盖动态数组存储、深拷贝机制、迭代器支持、容量调整、字符串修改、运算符重载等功能,模拟标准string核心特性,重点强... 目录实现框架一、默认成员函数1.默认构造函数2.构造函数3.拷贝构造函数(重点)4.赋值运算符重载函数

C#使用Spire.XLS快速生成多表格Excel文件

《C#使用Spire.XLS快速生成多表格Excel文件》在日常开发中,我们经常需要将业务数据导出为结构清晰的Excel文件,本文将手把手教你使用Spire.XLS这个强大的.NET组件,只需几行C#... 目录一、Spire.XLS核心优势清单1.1 性能碾压:从3秒到0.5秒的质变1.2 批量操作的优雅

Python使用python-pptx自动化操作和生成PPT

《Python使用python-pptx自动化操作和生成PPT》这篇文章主要为大家详细介绍了如何使用python-pptx库实现PPT自动化,并提供实用的代码示例和应用场景,感兴趣的小伙伴可以跟随小编... 目录使用python-pptx操作PPT文档安装python-pptx基础概念创建新的PPT文档查看

在ASP.NET项目中如何使用C#生成二维码

《在ASP.NET项目中如何使用C#生成二维码》二维码(QRCode)已广泛应用于网址分享,支付链接等场景,本文将以ASP.NET为示例,演示如何实现输入文本/URL,生成二维码,在线显示与下载的完整... 目录创建前端页面(Index.cshtml)后端二维码生成逻辑(Index.cshtml.cs)总结

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热

SQLServer中生成雪花ID(Snowflake ID)的实现方法

《SQLServer中生成雪花ID(SnowflakeID)的实现方法》:本文主要介绍在SQLServer中生成雪花ID(SnowflakeID)的实现方法,文中通过示例代码介绍的非常详细,... 目录前言认识雪花ID雪花ID的核心特点雪花ID的结构(64位)雪花ID的优势雪花ID的局限性雪花ID的应用场景

C#之枚举类型与随机数详解

《C#之枚举类型与随机数详解》文章讲解了枚举类型的定义与使用方法,包括在main外部声明枚举,用于表示游戏状态和周几状态,枚举值默认从0开始递增,也可手动设置初始值以生成随机数... 目录枚举类型1.定义枚举类型(main外)2.使用生成随机数总结枚举类型1.定义枚举类型(main外)enum 类型名字

Django HTTPResponse响应体中返回openpyxl生成的文件过程

《DjangoHTTPResponse响应体中返回openpyxl生成的文件过程》Django返回文件流时需通过Content-Disposition头指定编码后的文件名,使用openpyxl的sa... 目录Django返回文件流时使用指定文件名Django HTTPResponse响应体中返回openp