红联Linux门户
Linux帮助

Linux字符集的问题

发布时间:2014-08-04 21:51:16来源:linux网站作者:hopezhangbo

Linux系统登录或是远程操作时或者有时候当我们在字符终端下使用man 查看某个命令的说明文档时,其内容可能会因包含类似于“<A1><AE>”的一些乱码。在这种情况下,可以使用下面命令消除乱码:

[linux@www ~]$ unset LANG

这个是什么问题呢?这个就不得不得说一个概念——字符集,为何说道字符集,引用一段话:“locale 是国际化与本土化过程中的一个非常重要的概念,个人认为,对于中文用户来说,通常会涉及到的国际化或者本土化,大致包含三个方面:看中文,写中文,与 window中文系统的兼容和通信。从实际经验上看来,locale的设定与看中文关系不大,但是与写中文,及window分区的挂载方式有很密切的关系。”

 
一、查看字符集
字符集在系统中体现形式是一个环境变量,以RedHat为例(bshell)其查看当前终端使用字符集的方式可以有以下几种方式:


1)[linux@www ~]$env |grep LANG
LANG=zh_CN.GB18030


2) [linux@www ~]$ export |grep LANG
declare -x LANG="zh_CN.GB18030"


3)还有一个很强大的命令:locale
[linux@www ~]$ locale
LANG=zh_CN.GB18030
LC_CTYPE="zh_CN.GB18030"
LC_NUMERIC="zh_CN.GB18030"
LC_TIME="zh_CN.GB18030"
LC_COLLATE="zh_CN.GB18030"
LC_MONETARY="zh_CN.GB18030"
LC_MESSAGES="zh_CN.GB18030"
LC_PAPER="zh_CN.GB18030"
LC_NAME="zh_CN.GB18030"
LC_ADDRESS="zh_CN.GB18030"
LC_TELEPHONE="zh_CN.GB18030"
LC_MEASUREMENT="zh_CN.GB18030"
LC_IDENTIFICATION="zh_CN.GB18030"
LC_ALL=

上面均说明LC_CTYPE(字符辨识编码)表示这个系统的系统现在使用的字符集是zh_CN.GB18030,LC_NUMERIC(数字系统的显示讯息)等其它与语言相关的变量。通常如果其它的语言变量都未设定,仅设定LANG这个变量就可以缺省代替所有其它变量了。

 
二、修改字符集的方式
如果默认语言是en_US.UTF-8,在Linux的字符和图形界面下都是无法显示和输入中文的。如果默认语言是中文,比如zh_CN.GB18030 或者zh_CN.gb2312,字符界面无法显示和输入,图形界面可以。
修改的方式有如下两种:


1).直接设置变量的方式修改,命令如下两条命令:
[linux@www ~]$LANG=xxx 或者  export  LANG=xxx;
[linux@www ~]$LC_ALL=”xxx”  或者  export LC_ALL=”xxx”;
注:xxx为欲修改为的字符集
查看标准的字符集的方法,locale –a命令,常用的有zh_CN.GB2312、
zh_CN.GB18030或者zh_CN.UTF-8、en_US.UTF-8等
但是上述修改方式只会在当前shell中生效。新建shell此环境变量消失
故平时登录系统的执行“LANG= ”这个命令的时候显示的就没有乱码的缘故,意思就是取消了字符集的显示,和开篇提到的是一个意思


2)、修改文件方式,通过修改/etc/sysconfig/i18n文件控制
[linux@www ~]$ vi /etc/sysconfig/i18n
LANG="zh_CN.GB18030"    #==>此处即为系统的语言
SUPPORTED="zh_CN.UTF-8:zh_CN.GB18030:zh_CN:zh:en_US.UTF-8:en_US:en"
SYSFONT="lat0-sun16"
修改文件保存退出之后要生效要执行如下命令才可生效
[linux@www ~]$ source /etc/sysconfig/i18n
用户登录shell的时候会读取其中的设定值的