获取中文汉字的首字母

2024-08-22 05:48
文章标签 中文 获取 汉字 首字母

本文主要是介绍获取中文汉字的首字母,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

package com.tbs.common.utils;import java.util.Random;public class ChinaInitialUtil {public static void main(String[] args) {String str = "河北省";System.out.println("中文首字母:" + getPYIndexStr(str, true));}/*** * 返回首字母* * @param strChinese* * @param bUpCase* * @return*/public static String getPYIndexStr(String strChinese, boolean bUpCase) {try {StringBuffer buffer = new StringBuffer();byte b[] = strChinese.getBytes("GBK");// 把中文转化成byte数组for (int i = 0; i < b.length; i++) {if ((b[i] & 255) > 128) {int char1 = b[i++] & 255;char1 <<= 8;// 左移运算符用“<<”表示,是将运算符左边的对象,向左移动运算符右边指定的位数,并且在低位补零。其实,向左移n位,就相当于乘上2的n次方int chart = char1 + (b[i] & 255);buffer.append(getPYIndexChar((char) chart, bUpCase));continue;}char c = (char) b[i];if (!Character.isJavaIdentifierPart(c))// 确定指定字符是否可以是 Java// 标识符中首字符以外的部分。c = 'A';buffer.append(c);}return buffer.toString();} catch (Exception e) {System.out.println((new StringBuilder()).append("\u53D6\u4E2D\u6587\u62FC\u97F3\u6709\u9519").append(e.getMessage()).toString());}return null;}/*** * 得到首字母* * @param strChinese* * @param bUpCase* * @return*/private static char getPYIndexChar(char strChinese, boolean bUpCase) {int charGBK = strChinese;char result;if (charGBK >= 45217 && charGBK <= 45252)result = 'A';elseif (charGBK >= 45253 && charGBK <= 45760)result = 'B';elseif (charGBK >= 45761 && charGBK <= 46317)result = 'C';elseif (charGBK >= 46318 && charGBK <= 46825)result = 'D';elseif (charGBK >= 46826 && charGBK <= 47009)result = 'E';elseif (charGBK >= 47010 && charGBK <= 47296)result = 'F';elseif (charGBK >= 47297 && charGBK <= 47613)result = 'G';elseif (charGBK >= 47614 && charGBK <= 48118)result = 'H';elseif (charGBK >= 48119 && charGBK <= 49061)result = 'J';elseif (charGBK >= 49062 && charGBK <= 49323)result = 'K';elseif (charGBK >= 49324 && charGBK <= 49895)result = 'L';elseif (charGBK >= 49896 && charGBK <= 50370)result = 'M';elseif (charGBK >= 50371 && charGBK <= 50613)result = 'N';elseif (charGBK >= 50614 && charGBK <= 50621)result = 'O';elseif (charGBK >= 50622 && charGBK <= 50905)result = 'P';elseif (charGBK >= 50906 && charGBK <= 51386)result = 'Q';elseif (charGBK >= 51387 && charGBK <= 51445)result = 'R';elseif (charGBK >= 51446 && charGBK <= 52217)result = 'S';elseif (charGBK >= 52218 && charGBK <= 52697)result = 'T';elseif (charGBK >= 52698 && charGBK <= 52979)result = 'W';elseif (charGBK >= 52980 && charGBK <= 53688)result = 'X';elseif (charGBK >= 53689 && charGBK <= 54480)result = 'Y';elseif (charGBK >= 54481 && charGBK <= 55289)result = 'Z';elseresult = (char) (65 + (new Random()).nextInt(25));if (!bUpCase)result = Character.toLowerCase(result);return result;}}

这篇关于获取中文汉字的首字母的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095414

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

vscode中文乱码问题,注释,终端,调试乱码一劳永逸版

忘记咋回事突然出现了乱码问题,很多方法都试了,注释乱码解决了,终端又乱码,调试窗口也乱码,最后经过本人不懈努力,终于全部解决了,现在分享给大家我的方法。 乱码的原因是各个地方用的编码格式不统一,所以把他们设成统一的utf8. 1.电脑的编码格式 开始-设置-时间和语言-语言和区域 管理语言设置-更改系统区域设置-勾选Bata版:使用utf8-确定-然后按指示重启 2.vscode

Android Environment 获取的路径问题

1. 以获取 /System 路径为例 /*** Return root of the "system" partition holding the core Android OS.* Always present and mounted read-only.*/public static @NonNull File getRootDirectory() {return DIR_ANDR

解决Office Word不能切换中文输入

我们在使用WORD的时可能会经常碰到WORD中无法输入中文的情况。因为,虽然我们安装了搜狗输入法,但是到我们在WORD中使用搜狗的输入法的切换中英文的按键的时候会发现根本没有效果,无法将输入法切换成中文的。下面我就介绍一下如何在WORD中把搜狗输入法切换到中文。

JS和jQuery获取节点的兄弟,父级,子级元素

原文转自http://blog.csdn.net/duanshuyong/article/details/7562423 先说一下JS的获取方法,其要比JQUERY的方法麻烦很多,后面以JQUERY的方法作对比。 JS的方法会比JQUERY麻烦很多,主要则是因为FF浏览器,FF浏览器会把你的换行也当最DOM元素。 <div id="test"><div></div><div></div

vcpkg子包路径批量获取

获取vcpkg 子包的路径,并拼接为set(CMAKE_PREFIX_PATH “拼接路径” ) import osdef find_directories_with_subdirs(root_dir):# 构建根目录下的 "packages" 文件夹路径root_packages_dir = os.path.join(root_dir, "packages")# 如果 "packages"

Weex入门教程之4,获取当前全局环境变量和配置信息(屏幕高度、宽度等)

$getConfig() 获取当前全局环境变量和配置信息。 Returns: config (object): 配置对象;bundleUrl (string): bundle 的 url;debug (boolean): 是否是调试模式;env (object): 环境对象; weexVersion (string): Weex sdk 版本;appName (string): 应用名字;

sqlite不支持中文排序,采用java排序

方式一 不支持含有重复字段进行排序 /*** sqlite不支持中文排序,改用java排序* 根据指定的对象属性字段,排序对象集合,顺序* @param list* @param field* @return*/public static List sortListByField(List<?> list,String field){List temp = new ArrayList(

MFC中App,Doc,MainFrame,View各指针的互相获取

纸上得来终觉浅,为了熟悉获取方法,我建了个SDI。 首先说明这四个类的执行顺序是App->Doc->Main->View 另外添加CDialog类获得各个指针的方法。 多文档的获取有点小区别,有时间也总结一下。 //  App void CSDIApp::OnApp() {      //  App      //  Doc     CDocument *pD

android两种日志获取log4j

android   log4j 加载日志使用方法; 先上图: 有两种方式: 1:直接使用架包 加载(两个都要使用); 架包:android-logging-log4j-1.0.3.jar 、log4j-1.2.15.jar  (说明:也可以使用架包:log4j-1.2.17.jar)  2:对架包输入日志的二次封装使用; 1:直接使用 log4j 日志框架获取日志信息: A:配置 日志 文