1109 综合实验:文件操作与字符处理 SCAU

2024-04-22 01:08

本文主要是介绍1109 综合实验:文件操作与字符处理 SCAU,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1109 综合实验:文件操作与字符处理 SCAU

题目描述

Description

在当前目录中存在文件名为"case1.in"(其中case后为数字1,不是字母l,写错提交后会判错)的文本文件,
其内容为一篇英文文章(以EOF作为结束标志)。现要求读取该文本文件内容,统计文章中每个单词出现的次数,
并输出出现次数最多的前5个单词及其出现次数(按出现次数由多到少的顺序输出,次数相同时按字典顺序输出,
不足5个单词时,按序输出全部单词)。程序中注意如下细节:
(1) 空格、标点符号与回车符起到分隔单词的作用。
(2) 文章一行的末尾可能有连字符,出现连字符时,该行最末的字符串与下行最先出现的字符串构一个单词;
(3) 名词缩写算一个单词;
(4) 数字不算单词;
(5) 单词不区分大小写;
(6) 输出时单词全使用小写;

#include “stdio.h”
#include “math.h”
#include “string.h”
#include “stdlib.h”


main()
{
_______________________
}

输入格式
文件case1.in中一篇英文文章,包含多段文字,单词数不超过10000,每个单词不超过20个字符

输出格式
按题意输出答案

输入样例
(如case1.in内容如下)
I am a student. My school is SCAU. It is a beau-
tiful university. I like it.

输出样例
a 2
i 2
is 2
it 2
am 1

思路

用fgetc从文件中读取字符并进行处理,然后用选择排序的方法进行排序,最后输出。
使用结构体数组储存数据。

题目分析

从文件中读取文本内容,然后统计单词个数并按字典顺序和单词出现次数对单词进行排序,最后输出次数最多的前5个单词及其出现次数(按出现次数由多到少的顺序输出,次数相同时按字典顺序输出,不足5个单词时,按序输出全部单词),从而实现一个简单的统计排序功能。

变量说明

结构体d_word 储存单词和单词出现次数,使用结构体数组d_word T[10005]储存去重排序处理后单词信息,字符数组char words[10005] [25]储存从文件中读取的初始单词信息。

算法描述

使用选择排序的方法对单词次数从大到小排序,同时对单词出现次数相同的单词进行字典排序。选择排序的时间复杂度是O(n*n)。

单词去重和统计次数使用遍历数组的暴力算法,把初始读入的words数组中的元素一一与结构体数组T中元素比较,如果数组T中不存在该单词,则复制words数组中单词进T中,单词出现次数加1;若已经存在该单词,找到该单词所在数组位置,该单词出现次数加1。时间复杂度也是n的平方。

总结

一开始读取文件使用了fscanf读入一个字符串,然后发现读入之后较难进行单词处理,所以改用了每次读取一个字符的方法,对字符进行处理判断,并以读入单词,标点符号,回车符作为一个单词结束的标志。这样可以比较方便地处理分割单词,并且对一些不属于单词的字符可以不用读入数组中,比如空格或换行符,只是在写判断单词结束条件时花了比较多的时间。然后是排序那里一开始使用的是快排,后来发现快排写字典排序反而超时了,就使用了较简单的选择排序,复杂度是n的平方。运行时间是736 ms。

代码


#include "stdio.h"
#include "math.h"
#include "string.h"
#include "stdlib.h"typedef struct d_word
{char word[25] = {'\0'};int time = 0;
} d_word;int getfile(char words[][25],d_word T[])//从文件中读取单词并返回单词个数
{FILE* fp;fp = fopen("case1.in", "r");if (fp==NULL){printf ("error");exit(0);}char temp[25],ch,ch1;int i, j, q=0, k,n=0,num=0;while((ch=fgetc(fp))!=EOF){if(ch>='a'&&ch<='z')words[n][q++]=ch;else if(ch>='A'&&ch<='Z')words[n][q++]=ch+32;else if(ch=='-')//判断是否为连字符{ch=fgetc(fp);if(ch=='\n')continue;else{n++;q=0;if(ch>='a'&&ch<='z')words[n][q++]=ch;else if(ch>='A'&&ch<='Z')words[n][q++]=ch+32;}}else{n++;q=0;}}for(i=0; i<n; i++){if(words[i][0]<'a'||words[i][0]>'z'){words[i][0]='\0';}}fclose(fp);return n;
}int De_duplication(int n,d_word T[],char words[][25])//单词去重+统计出现次数
{int num = 0;int i, j, k;int flag = 0;for (i = 0; i < n; i++){for (j = 1,flag=0; j <= num&&words[i][0]!='\0'; j++){if (strcmp(words[i], T[j].word)==0){flag = 1;T[j].time++;break;}}if (flag != 1&&words[i][0]!='\0'){num++;strcpy(T[j].word, words[i]);T[j].time++;}flag=0;}return num;
}void Sort(d_word T[],int m)//选择排序
{int i,j,k;char temp[25];for (i = 1; i < m ; i++){k = i;for (j = i + 1; j <= m; j++)if (T[k].time < T[j].time || (T[k].time == T[j].time && strcmp(T[k].word, T[j].word) > 0))k = j;if (k != i){int t = T[k].time;T[k].time = T[i].time;T[i].time = t;memset(temp,0,sizeof(temp));strcpy(temp, T[k].word);memset(T[k].word,0,sizeof(T[k].word));strcpy(T[k].word, T[i].word);memset(T[i].word,0,sizeof(T[i].word));strcpy(T[i].word, temp);}}return;
}int main()
{char words[10005][25];int i, j, k, n, m;d_word T[10005];n=getfile(words,T);//读取文件m=De_duplication(n,T,words);//去重+计数Sort(T, m);//选择排序for (i=1; i<=5&&i<=m; i++){printf("%s %d\n",T[i].word,T[i].time);}return 0;
}
参考(https://blog.csdn.net/Hunter_Kevin/article/details/117005682)

这篇关于1109 综合实验:文件操作与字符处理 SCAU的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/924486

相关文章

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

使用C++将处理后的信号保存为PNG和TIFF格式

《使用C++将处理后的信号保存为PNG和TIFF格式》在信号处理领域,我们常常需要将处理结果以图像的形式保存下来,方便后续分析和展示,C++提供了多种库来处理图像数据,本文将介绍如何使用stb_ima... 目录1. PNG格式保存使用stb_imagephp_write库1.1 安装和包含库1.2 代码解

C++实现封装的顺序表的操作与实践

《C++实现封装的顺序表的操作与实践》在程序设计中,顺序表是一种常见的线性数据结构,通常用于存储具有固定顺序的元素,与链表不同,顺序表中的元素是连续存储的,因此访问速度较快,但插入和删除操作的效率可能... 目录一、顺序表的基本概念二、顺序表类的设计1. 顺序表类的成员变量2. 构造函数和析构函数三、顺序表

使用C++实现单链表的操作与实践

《使用C++实现单链表的操作与实践》在程序设计中,链表是一种常见的数据结构,特别是在动态数据管理、频繁插入和删除元素的场景中,链表相比于数组,具有更高的灵活性和高效性,尤其是在需要频繁修改数据结构的应... 目录一、单链表的基本概念二、单链表类的设计1. 节点的定义2. 链表的类定义三、单链表的操作实现四、

Python利用自带模块实现屏幕像素高效操作

《Python利用自带模块实现屏幕像素高效操作》这篇文章主要为大家详细介绍了Python如何利用自带模块实现屏幕像素高效操作,文中的示例代码讲解详,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、获取屏幕放缩比例2、获取屏幕指定坐标处像素颜色3、一个简单的使用案例4、总结1、获取屏幕放缩比例from

通过prometheus监控Tomcat运行状态的操作流程

《通过prometheus监控Tomcat运行状态的操作流程》文章介绍了如何安装和配置Tomcat,并使用Prometheus和TomcatExporter来监控Tomcat的运行状态,文章详细讲解了... 目录Tomcat安装配置以及prometheus监控Tomcat一. 安装并配置tomcat1、安装

Python中操作Redis的常用方法小结

《Python中操作Redis的常用方法小结》这篇文章主要为大家详细介绍了Python中操作Redis的常用方法,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解一下... 目录安装Redis开启、关闭Redisredis数据结构redis-cli操作安装redis-py数据库连接和释放增