理解CentOS7.4/docker terminal 编码 locale中文支持

2024-03-30 08:48

本文主要是介绍理解CentOS7.4/docker terminal 编码 locale中文支持,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 获取编码格式

    From How to get terminal’s Character Encoding, the terminal uses environment variables to determine which character set to use, therefore you can determine it by looking at those variables: echo $LANG

  • locale

    Locales are used in Linux to define which language and character set (encoding) user see in the terminal.

    Locale is defined in the following format:

    <LANGUAGE>_<TERRITORY>.<CODESET>[@<MODIFIERS>]

    ITEMsFORMAT
    LANGUAGEISO 639 language code
    TERRITORYISO 3166 country code
    CODESETCharacter set or encoding identifier, like ISO-8859-1 or UTF-8

    locale是一个综合性的概念,是根据计算机用户所使用的语言、所在国家或者地区、当地的文化传统所定义的一个软件运行时的语言环境。

    这个语言环境可以按照所涉及的不同领域划分成几大类:用户所使用的语言符号及其分类(LC_CTYPE),数字 (LC_NUMERIC),比较和排序习惯(LC_COLLATE),时间显示格式(LC_TIME),货币单位(LC_MONETARY),信息主要是提示信息,错误信息, 状态信息, 标题, 标签, 按钮和菜单等(LC_MESSAGES),姓名书写方式(LC_NAME),地址书写方式(LC_ADDRESS),电话号码书写方式 (LC_TELEPHONE),度量衡表达方式(LC_MEASUREMENT),默认纸张尺寸大小(LC_PAPER)和locale对自身包含信息的概述(LC_IDENTIFICATION)。

    这些locale定义文件放在/usr/share/i18n/locales目录下

  • locale issues

    There are two questions: how to check and change the current locale and language settings from the command line in Linux.

    • check current locale and language settings
      # current locale and language settings
      $ locale 
      # list all enabled locales
      $ locale -a
      # list available encoding
      $ locale -m
      # locale and language settings are defined in the LANG variable
      $ echo $LANG
      
    • change the current locale and language settings
      • add new locale

        Before a locale can be enabled on the system, it must be generated.

        If you didn’t find the desired language or encoding in the list of enabled locales(locale -a), you can search for them in the list of all supported locales and install whatever you need.

        # for centos
        $ localedef --list-archive # list the all supported(available for generation) locales
        $ localedef -- list-archive | grep zh_CN.UTF-8 # find the desired locale 这一句好像无效
        $ sudo localedef -c -i zh_CN(locale定义文件) -f UTF-8(字符集) zh_CN.UTF-8 # generate it 
        $ locale -a | grep zh_CN.utf8 # available
        
      • already have useable locale

        To set the required locale and language for the current sesion - it is just needed to redefine LANG variable.

        $ LANG=zh_CN.utf8 # =两边不能有空格
        

        此方法设置后,echo $LANG 虽然显示zh_CN.utf8,但实际运行过程中中文还是乱码,而且locale命令下LANG未改变。

        $ export 
        
    • Define locale and language permanently

      Set the required value of the LANG variable in a user’s bash profile and the needed locale and language settings will be automatically loaded upon the each session.

      Put export LANG=zh_CN.utf8 line to the ~./bashrc or ~/.profile files.

      then source ~/.profile

  • Dockerfile

    修改基础镜像中文locale支持

    RUN yum -y update \&& yum install kde-l10n-Chinese -y \&& yum reinstall glibc-common -y \&& localedef -c -f UTF-8 -i zh_CN zh_CN.UTF-8 \&& echo 'LANG="zh_CN.UTF-8"' > /etc/locale.conf \&& source /etc/locale.conf
    ENV LC_ALL=zh_CN.UTF-8 \LANG=zh_CN.UTF-8
    
  • Reference

  1. Linux: Define Locale and Language Settings

  2. 关于locale的设定,为什么要设定locale

  3. CentOS7及Docker配置中文字符集问题

这篇关于理解CentOS7.4/docker terminal 编码 locale中文支持的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/861029

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

【C++高阶】C++类型转换全攻略:深入理解并高效应用

📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C++ “ 登神长阶 ” 🤡往期回顾🤡:C++ 智能指针 🌹🌹期待您的关注 🌹🌹 ❀C++的类型转换 📒1. C语言中的类型转换📚2. C++强制类型转换⛰️static_cast🌞reinterpret_cast⭐const_cast🍁dynamic_cast 📜3. C++强制类型转换的原因📝

深入理解RxJava:响应式编程的现代方式

在当今的软件开发世界中,异步编程和事件驱动的架构变得越来越重要。RxJava,作为响应式编程(Reactive Programming)的一个流行库,为Java和Android开发者提供了一种强大的方式来处理异步任务和事件流。本文将深入探讨RxJava的核心概念、优势以及如何在实际项目中应用它。 文章目录 💯 什么是RxJava?💯 响应式编程的优势💯 RxJava的核心概念

如何通俗理解注意力机制?

1、注意力机制(Attention Mechanism)是机器学习和深度学习中一种模拟人类注意力的方法,用于提高模型在处理大量信息时的效率和效果。通俗地理解,它就像是在一堆信息中找到最重要的部分,把注意力集中在这些关键点上,从而更好地完成任务。以下是几个简单的比喻来帮助理解注意力机制: 2、寻找重点:想象一下,你在阅读一篇文章的时候,有些段落特别重要,你会特别注意这些段落,反复阅读,而对其他部分

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

vscode中文乱码问题,注释,终端,调试乱码一劳永逸版

忘记咋回事突然出现了乱码问题,很多方法都试了,注释乱码解决了,终端又乱码,调试窗口也乱码,最后经过本人不懈努力,终于全部解决了,现在分享给大家我的方法。 乱码的原因是各个地方用的编码格式不统一,所以把他们设成统一的utf8. 1.电脑的编码格式 开始-设置-时间和语言-语言和区域 管理语言设置-更改系统区域设置-勾选Bata版:使用utf8-确定-然后按指示重启 2.vscode

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return