C++的中英文字符串表示(string,wstring)

2023-10-22 23:10

本文主要是介绍C++的中英文字符串表示(string,wstring),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

   在C++中字符串类的string的模板原型是basic_string

 

template <class _Elem, class traits = char_traits<_Elem>class _Ax = allocator<_Elem>>
class basic_string{};

 

     第一个参数_Elem表示类型。第二个参数traits的缺省值使用char_traits类型,定义了类型和字符操作的函数,如比较、等价、分配等。第三个参数_Ax的默认值是allocator类,表示了内存模式,不同的内存结构将操作指针的不同行为,例如栈、堆或段内存模式等。

     在C++标准里定义了两个字符串string和wstring

typedef basic_string<char> string ;
typedef basic_string
<wchar_t> wstring;

 

     前者string是常用类型,可以看作char[],其实这正是与string定义中的_Elem=char相一致。而wstring,使用的是wchar_t类型,这是宽字符,用于满足非ASCII字符的要求,例如Unicode编码,中文,日文,韩文什么的。对于wchar_t类型,实际上C++中都用与char函数相对应的wchar_t的函数,因为他们都是从同一个模板类似于上面的方式定义的。因此也有wcout, wcin, werr等函数。

     实际上string也可以使用中文,但是它将一个汉字写在2个char中。而如果将一个汉字看作一个单位wchar_t的话,那么在wstring中就只占用一个单元,其它的非英文文字和编码也是如此。这样才真正的满足字符串操作的要求,尤其是国际化等工作。

     看一下下面的程序,就会理解两者的差别。

 

#include <iostream>
#include 
<string>
using namespace  std;

#define tab "/t"


int  main()
{
    locale def;
    cout
<<def.name()<<
endl;
    locale current 
=
 cout.getloc();
    cout
<<current.name()<<
endl;

    
float val=1234.56
;
    cout
<<val<<
endl;

    
//chage to french/france

    cout.imbue(locale("chs" ));
    current
=
cout.getloc();
    cout
<<current.name()<<
endl;
    cout
<<val<<
endl;

    
//上面是说明locale的用法,下面才是本例的内容,因为其中用到了imbue函数

    cout<<"*********************************"<< endl;

    
//为了保证本地化输出(文字/时间/货币等),chs表示中国,wcout必须使用本地化解析编码

    wcout.imbue(std::locale("chs" ));

    
//string 英文,正确颠倒位置,显示第二个字符正确

    string str1("ABCabc" );
    
string
 str11(str1.rbegin(),str1.rend());
    cout
<<"UK/ts1/t:"<<str1<<tab<<str1[1]<<tab<<str11<<
endl;

    
//wstring 英文,正确颠倒位置,显示第二个字符正确

    wstring str2=L"ABCabc" ;
    wstring str22(str2.rbegin(),str2.rend());
    wcout
<<"UK/tws4/t:"<<str2<<tab<<str2[1]<<tab<<str22<<
endl;

    
//string 中文,颠倒后,变成乱码,第二个字符读取也错误

    string str3("你好么?" );
    
string
 str33(str3.rbegin(),str3.rend());
    cout
<<"CHN/ts3/t:"<<str3<<tab<<str3[1]<<tab<<str33<<
endl;

    
//正确的打印第二个字符的方法

    cout<<"CHN/ts3/t:RIGHT/t"<<str3[2]<<str3[3]<< endl;

    
//中文,正确颠倒位置,显示第二个字符正确

    wstring str4=L"你好么?" ;
    wstring str44(str4.rbegin(),str4.rend());
    wcout
<<"CHN/tws4/t:"<<str4<<tab<<str4[1]<<tab<<str44<<
endl;

    wstring str5(str1.begin(),str1.end());
//只有char类型的string时才可以如此构造

    wstring str55(str5.rbegin(),str5.rend());
    wcout
<<"CHN/tws5/t:"<<str5<<tab<<str5[1]<<tab<<str55<<
endl;

    wstring str6(str3.begin(),str3.end());
//如此构造将失败!!!!

    wstring str66(str6.rbegin(),str6.rend());
    wcout
<<"CHN/tws6/t:"<<str6<<tab<<str6[1]<<tab<<str66<<
endl;

    
return 0
;
}

 

结果如下:

     上面显示了本地化的作用,是在数字中每三位加一个逗号,其实对时间/文字等都是用影响的。

     下面的输出说明了,如何正确使用string和wstring的方法。第三个因为使用string来表示汉字,出现了一些错误。最后一行也是错误,导致了输出也受到了影响,没有空格与回车。(最后两个就不要管中英文了,仅仅说明一下中文构造方法是错误的)

     《掌握标准C++类》在第十二章《语言支持》中专门讲C++的国际化和本地化问题,C++提供了I18N的标准处理,软件开发者可以参考。

       C++标准库还是非常博大精深的,功能比较齐全的。继续学习。

 

 

 

出处:http://www.cnblogs.com/xiaoyz/archive/2008/10/11/1308860.html

这篇关于C++的中英文字符串表示(string,wstring)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/264165

相关文章

VSCode中C/C++编码乱码问题的两种解决方法

《VSCode中C/C++编码乱码问题的两种解决方法》在中国地区,Windows系统中的cmd和PowerShell默认编码是GBK,但VSCode默认使用UTF-8编码,这种编码不一致会导致在VSC... 目录问题方法一:通过 Code Runner 插件调整编码配置步骤方法二:在 PowerShell

C/C++随机数生成的五种方法

《C/C++随机数生成的五种方法》C++作为一种古老的编程语言,其随机数生成的方法已经经历了多次的变革,早期的C++版本使用的是rand()函数和RAND_MAX常量,这种方法虽然简单,但并不总是提供... 目录C/C++ 随机数生成方法1. 使用 rand() 和 srand()2. 使用 <random

Java反转字符串的五种方法总结

《Java反转字符串的五种方法总结》:本文主要介绍五种在Java中反转字符串的方法,包括使用StringBuilder的reverse()方法、字符数组、自定义StringBuilder方法、直接... 目录前言方法一:使用StringBuilder的reverse()方法方法二:使用字符数组方法三:使用自

Golang中拼接字符串的6种方式性能对比

《Golang中拼接字符串的6种方式性能对比》golang的string类型是不可修改的,对于拼接字符串来说,本质上还是创建一个新的对象将数据放进去,主要有6种拼接方式,下面小编就来为大家详细讲讲吧... 目录拼接方式介绍性能对比测试代码测试结果源码分析golang的string类型是不可修改的,对于拼接字

Win32下C++实现快速获取硬盘分区信息

《Win32下C++实现快速获取硬盘分区信息》这篇文章主要为大家详细介绍了Win32下C++如何实现快速获取硬盘分区信息,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 实现代码CDiskDriveUtils.h#pragma once #include <wtypesbase

C++ Primer 标准库vector示例详解

《C++Primer标准库vector示例详解》该文章主要介绍了C++标准库中的vector类型,包括其定义、初始化、成员函数以及常见操作,文章详细解释了如何使用vector来存储和操作对象集合,... 目录3.3标准库Vector定义和初始化vector对象通列表初始化vector对象创建指定数量的元素值

C++实现回文串判断的两种高效方法

《C++实现回文串判断的两种高效方法》文章介绍了两种判断回文串的方法:解法一通过创建新字符串来处理,解法二在原字符串上直接筛选判断,两种方法都使用了双指针法,文中通过代码示例讲解的非常详细,需要的朋友... 目录一、问题描述示例二、解法一:将字母数字连接到新的 string思路代码实现代码解释复杂度分析三、

Java对象和JSON字符串之间的转换方法(全网最清晰)

《Java对象和JSON字符串之间的转换方法(全网最清晰)》:本文主要介绍如何在Java中使用Jackson库将对象转换为JSON字符串,并提供了一个简单的工具类示例,该工具类支持基本的转换功能,... 目录前言1. 引入 Jackson 依赖2. 创建 jsON 工具类3. 使用示例转换 Java 对象为

C# string转unicode字符的实现

《C#string转unicode字符的实现》本文主要介绍了C#string转unicode字符的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随... 目录1. 获取字符串中每个字符的 Unicode 值示例代码:输出:2. 将 Unicode 值格式化

golang字符串匹配算法解读

《golang字符串匹配算法解读》文章介绍了字符串匹配算法的原理,特别是Knuth-Morris-Pratt(KMP)算法,该算法通过构建模式串的前缀表来减少匹配时的不必要的字符比较,从而提高效率,在... 目录简介KMP实现代码总结简介字符串匹配算法主要用于在一个较长的文本串中查找一个较短的字符串(称为