JAVA读取文件单词出现次数_用javaIO流读取文本中英文字母和英文单词的出现次数及频率...

2024-01-25 18:30

本文主要是介绍JAVA读取文件单词出现次数_用javaIO流读取文本中英文字母和英文单词的出现次数及频率...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、读取文本中英文字母出现的次数并降序输出英文字母的百分比

源码;

package total;

import java.io.BufferedReader;

import java.io.FileReader;

import java.io.IOException;

import java.util.Arrays;

public class Statistics_letter {

public static void main(String[] args) throws IOException {

// TODO Auto-generated method stub

FileReader fr=new FileReader("a.txt");

BufferedReader bufr=new BufferedReader(fr);

StringBuffer str=new StringBuffer();

String Line=null;

while((Line=bufr.readLine())!=null) {

str.append(Line);

}

bufr.close();

double capitalletter[]=new double[26];

double lowercaseletter[]=new double[26];

int count=0;

for(int i=0;i

char ch=str.charAt(i);

if(ch>='A'&&ch<='Z'||ch>='a'&&ch<='z') {

for(int j=0;j<26;j++) {

if(ch=='A'+j)

capitalletter[j]++;

}

for(int k=0;k<26;k++) {

if(ch=='a'+k)

lowercaseletter[k]++;

}

count++;

}

}

double percentage1[]=new double[52];

double percentage2[]=new double[52];

for(int i=0;i<26;i++) {

percentage1[i]=capitalletter[i]/count;

percentage2[i]=percentage1[i];

}

for(int i=26;i<52;i++) {

percentage1[i]=lowercaseletter[i-26]/count;

percentage2[i]=percentage1[i];

}

Arrays.sort(percentage1);

for(int i=51;i>=0;i--) {

int max=0;

for(int j=0;j<52;j++) {

if(percentage2[j]==percentage1[i])

max=j;

}

if(max>=26)

System.out.print(((char)('a'+max-26))+":");

else

System.out.print(((char)('A'+max))+":");

System.out.println(String.format("%.2f",percentage1[i]*100)+'%');

}

System.out.println("英文字母总数为:"+count);

}

}

运行结果截图:

c25aff2387de234f768bbf7815dd71d0.png

二、读取文本中的英文单词并按出现次数降序输出结果

源码:

package total;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.io.OutputStreamWriter;

import java.util.HashMap;

import java.util.Map;

public class Statistics_words {

public Map map1 = new HashMap();

public static void main(String arg[]) throws IOException {

String sz[];

Integer num[];

final int MAXNUM = 20;

sz = new String[MAXNUM + 1];

num = new Integer[MAXNUM + 1];

Statistics_words Statistics_words = new Statistics_words();

int account = 1;

// Vector ve1=new Vector();

Statistics_words.textImport();

System.out.println("文本出现单词的次数情况为:");

int g_run = 0;

for (g_run = 0; g_run < MAXNUM + 1; g_run++) {

account = 1;

for (Map.Entry it : Statistics_words.map1.entrySet()) {

if (account == 1) {

sz[g_run] = it.getKey();

num[g_run] = it.getValue();

account = 2;

}

if (account == 0) {

account = 1;

continue;

}

if (num[g_run] < it.getValue()) {

sz[g_run] = it.getKey();

num[g_run] = it.getValue();

}

// System.out.println("英文单词: "+it.getKey()+" 该英文单词出现次数: "+it.getValue());

}

Statistics_words.map1.remove(sz[g_run]);

}

int g_count = 1;

String tx1 = new String();

for (int i = 0; i < g_run; i++) {

if (sz[i] == null)

continue;

if (sz[i].equals(""))

continue;

tx1 += "出现次数第" + (g_count) + "多的单词为:" + sz[i] + "\t\t\t出现次数: " + num[i] + "\r\n";

System.out.println("出现次数第" + (g_count) + "多的单词为:" + sz[i] + "\t\t\t出现次数: " + num[i]);

g_count++;

}

Statistics_words.textExport(tx1);

}

public void textImport() throws IOException {

File a = new File("C:\\Users\\22400\\Desktop\\a.txt");

FileInputStream b = new FileInputStream(a);

InputStreamReader c = new InputStreamReader(b, "UTF-8");

String string2 = new String();

while (c.ready()) {

char string1 = (char) c.read();

if (!isWord(string1)) {

if (map1.containsKey(string2)) {

Integer num1 = map1.get(string2) + 1;

map1.put(string2, num1);

} else {

Integer num1 = 1;

map1.put(string2, num1);

}

string2 = "";

} else {

string2 += string1;

}

}

if (!string2.isEmpty()) {

if (map1.containsKey(string2)) {

Integer num1 = map1.get(string2) + 1;

map1.put(string2, num1);

} else {

Integer num1 = 1;

map1.put(string2, num1);

}

string2 = "";

}

c.close();

b.close();

}

public void textExport(String txt) throws IOException {

File fi = new File("StatisticsWord.txt");

FileOutputStream fop = new FileOutputStream(fi);

OutputStreamWriter ops = new OutputStreamWriter(fop, "UTF-8");

ops.append(txt);

ops.close();

fop.close();

}

public boolean isWord(char a) {

if (a <= 'z' && a >= 'a' || a <= 'Z' && a >= 'A')

return true;

return false;

}

}

426fea207c4312847586c4a780c46395.png

标签:java,String,英文字母,javaIO,英文单词,run,import,new,string2

来源: https://www.cnblogs.com/weixiao1717/p/12151740.html

这篇关于JAVA读取文件单词出现次数_用javaIO流读取文本中英文字母和英文单词的出现次数及频率...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/644192

相关文章

Java实现Excel与HTML互转

《Java实现Excel与HTML互转》Excel是一种电子表格格式,而HTM则是一种用于创建网页的标记语言,虽然两者在用途上存在差异,但有时我们需要将数据从一种格式转换为另一种格式,下面我们就来看看... Excel是一种电子表格格式,广泛用于数据处理和分析,而HTM则是一种用于创建网页的标记语言。虽然两

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Java中Springboot集成Kafka实现消息发送和接收功能

《Java中Springboot集成Kafka实现消息发送和接收功能》Kafka是一个高吞吐量的分布式发布-订阅消息系统,主要用于处理大规模数据流,它由生产者、消费者、主题、分区和代理等组件构成,Ka... 目录一、Kafka 简介二、Kafka 功能三、POM依赖四、配置文件五、生产者六、消费者一、Kaf

Java访问修饰符public、private、protected及默认访问权限详解

《Java访问修饰符public、private、protected及默认访问权限详解》:本文主要介绍Java访问修饰符public、private、protected及默认访问权限的相关资料,每... 目录前言1. public 访问修饰符特点:示例:适用场景:2. private 访问修饰符特点:示例:

详解Java如何向http/https接口发出请求

《详解Java如何向http/https接口发出请求》这篇文章主要为大家详细介绍了Java如何实现向http/https接口发出请求,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 用Java发送web请求所用到的包都在java.net下,在具体使用时可以用如下代码,你可以把它封装成一

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

java脚本使用不同版本jdk的说明介绍

《java脚本使用不同版本jdk的说明介绍》本文介绍了在Java中执行JavaScript脚本的几种方式,包括使用ScriptEngine、Nashorn和GraalVM,ScriptEngine适用... 目录Java脚本使用不同版本jdk的说明1.使用ScriptEngine执行javascript2.