C语言练习题之 数组中出现次数超过一半的数

2024-09-08 04:44

本文主要是介绍C语言练习题之 数组中出现次数超过一半的数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题目描述

给一个长度为 n 的数组,数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。

例如输入一个长度为9的数组[1,2,3,2,2,2,5,4,2]。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。

数据范围:n≤50000,数组中元素的值0≤val≤10000

要求:空间复杂度:O(1),时间复杂度O(n)

输入描述:

保证数组输入非空,且保证有解

示例1

输入:[1,2,3,2,2,2,5,4,2]

返回值:2

示例2

输入:[3,3,3,3,2,2,2]

返回值:3

示例3

输入:[1]

返回值:1

分析如下:

        题目意思比较明确,就是要找出数组中的一个数字,这个数字在数组中出现次数超过数组长度的一半。

        而题目提供的数组长度是≤50000,数组中元素的取值是 0 - 10000。

        基于这些信息,很容易从循环的角度出发,对数组每个数字进行循环统计。

代码如下:

//循环法查找
int find(int arr[], int sz)
{if (sz == 0)		//如果数组内没有元素,则返回-1。return -1;int i = 0;int j = 0;for (i = 0; i < sz; i++)	//遍历数组,每个数都查一遍{int count = 0;for (j = 0; j < sz; j++)	//数组中每个数与数组中其余数遍历一遍{if (arr[j] == arr[i] && i!= j)	//遍历过程中,与第i个数值相同,则计数+1,{count++;}if (count > sz / 2)	//当计数大于数组一半时,返回该数值。return arr[i];}}
}

        可以看到,循环法做起来很简单。但题目要求空间复杂度:O(1),时间复杂度O(n)。空间复杂度:O(1),即占用的内存空间不以数据量的变化而变化,无论多少数据,函数占用的内存是固定的;时间复杂度O(n),即花费的时间与数组元素成正比。

        上述解法中,空间复杂度满足,时间复杂度不满足,所以需要改进。之前我们介绍过用空间换时间的思路,即将所有可能的情况都列举出来,这里可以用一样的思路。

        根据题意,所求的返回值一定是 0-10000 这10001个数中的一个,所以如果提供一个容量为10001的数组,就可以把所求值的所有情况包含进去。然后遍历一遍即可。

代码如下:


int find(int arr[], int sz)
{if (sz == 0)		//如果数组内没有元素,则返回-1。return -1;int i = 0;int j = 0;int count[10001] = { 0 };	//题目中数组arr的取值范围是0-10000,则满足条件的数一定在这10001个数中//建立一个数组,包含10001个元素,对应arr数组中可能出现的10001种数值for (i = 0; i < sz; i++)	//遍历数组,对每种元素进行统计count[arr[i]]++;	//对arr数组中每种数值计数//如果arr数组中1出现了10次,则count[1]就是10;//5出现1000次,则count[5]就是1000;//假设n出现次数超出arr数组元素数一半,则n就是要找的值,即count[n] > sz/2for (i = 0; i < 10001; i++)	//遍历count数组{if (count[i] > sz / 2)	//找出满足条件的nreturn i;			//返回该值}
}

        这个思路可以算是穷举法。遍历过程中,arr数组中出现哪个数值,就对计数数组的对应位元素+1,统计出arr数组中每个数出现的个数,然后对技术数组遍历一遍,就能找到出现次数超过一半的数字了。

        这里空间复杂度是固定值,满足条件,时间复杂度是n+10001,也满足条件。但是占用空间过大,时间也较长,不符合实际,所以我们需要再优化。

        根据题意,所求的值 a 在数组中出现的次数一定是大于一半的。也就是说,如果对数组中的元素进行遍历,与 a 相同的数量减去与 a 不同的数量,结果一定大于0。

        那么我们假设一个 a ,从第一个数开始计算,与 a 相同则计数+1,不同则计数-1。若 a 是所求值,则最终结果大于0,返回 a;若 a 不是所求值,则将可能值赋给 a,继续计数,找到统计结果大于0的,就是所求值。

代码如下:

//优化解法
//前述解法占用内存空间太大,满足题目要求,但不符合实际。对其进行优化
//根据题意可以想到,返回值出现的次数比其余所有值出现的次数总和都多
//那么对数组元素进行计数,与返回值相同则数值+1,不同则数值-1
//因为返回值占总数一半以上,所以最后统计的数值一定大于0
//基于这个思路,从第一个元素开始计数,后一个元素与其不相等,则计数-1;相等则计数+1;
//当计数小于0时,则更换为新元素
//由于返回值占总数一半以上,所以其统计值最终必然大于0
int find(int* arr, int sz)
{if (sz == 0)	//如果数组内没有元素,则返回-1。return -1;int i = 0;int	count = 0;int a = arr[0];	//初始参考值设为数组第一个元素for (i = 0; i < sz; i++)	//遍历一遍,进行计数{if (arr[i] == a)	//第i个元素与参考值相同则计数+1count++;else				//第i个元素与参考值不相同时分项处理{if (count > 0)	//当之前计数大于0,则计数-1count--;else			//当之前计数为0,则将arr[i]赋值给参考值a,并计数为1{a = arr[i];count = 1;}}}return a;	//返回参考值
}
//可以看到,上述解法中,每个数值会统计一次,假设所求值是n
//参考值为n时,比较值为n, + 1,比较值为其他数, - 1;最后大于0
//参考值不为n时,比较值为n, - 1,比较值为其他数, + 1或 - 1;最后小于0,变为n,大于0
//占用内存少,且时间复杂度为O(n),满足题目要求

        可以看到,如果参考值是所求值 a,比较结束,最后结果大于0。如果参考值不是所求值 a,会被赋新值,因为所求值出现的总数最高,则遍历之后,最后 a一定会被赋值为所求值,比较结束后,结果也一定大于0。而大于0作为判断条件,就可以筛选出正确结果。

        这种解法的空间复杂度是固定值,且比较小,时间复杂度为n,满足题意。

        此方法细想容易绕晕,只要抓住核心,所求值 a 的数量占总数一半以上,就比较好理解了。以此核心为基础,在其为参考值时进行加法运算,其他数为参考值时进行减法运算,即可求得结果。

这篇关于C语言练习题之 数组中出现次数超过一半的数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1147148

相关文章

hdu2241(二分+合并数组)

题意:判断是否存在a+b+c = x,a,b,c分别属于集合A,B,C 如果用暴力会超时,所以这里用到了数组合并,将b,c数组合并成d,d数组存的是b,c数组元素的和,然后对d数组进行二分就可以了 代码如下(附注释): #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<que

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

hdu 1166 敌兵布阵(树状数组 or 线段树)

题意是求一个线段的和,在线段上可以进行加减的修改。 树状数组的模板题。 代码: #include <stdio.h>#include <string.h>const int maxn = 50000 + 1;int c[maxn];int n;int lowbit(int x){return x & -x;}void add(int x, int num){while

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

dp算法练习题【8】

不同二叉搜索树 96. 不同的二叉搜索树 给你一个整数 n ,求恰由 n 个节点组成且节点值从 1 到 n 互不相同的 二叉搜索树 有多少种?返回满足题意的二叉搜索树的种数。 示例 1: 输入:n = 3输出:5 示例 2: 输入:n = 1输出:1 class Solution {public int numTrees(int n) {int[] dp = new int

hdu 3065 AC自动机 匹配串编号以及出现次数

题意: 仍旧是天朝语题。 Input 第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,