必赢亚洲手机app下载


苹果电脑苹果电脑获取Android Studio的昭示版SHA1和开版SHA1

双双11来了,最符合做筹划之6款笔记本电脑,你想置哪款?

苹果电脑字符编码详解——彻底了解掌握编码知识,“乱码”不复存在

各级一个程序员都不可避免的逢字符编码的题材,特别是做Web开发的程序员,“乱码问题”一直是被人口头疼的题目,也许你都十分少遇到“乱码”问题,然而,对化解乱码的主意的内在规律,您是不是清楚?本人作为一个程序员,在字符编码方面同样遇到很多问题,而且直接针对各种编码懵懵懂懂、不清不楚;在工作中也曾经碰到一个怪可恶的编码问题。这有限上在网上搜集了汪洋编码方面的素材,对字符编码算是明白的比较清楚了。下面将自身认为比较重大之知识点记录下来,一方面有利于以后复习;另一方面为期望给跟自家同懵懵懂懂的人口一个参阅。不对或不妥之远在,请批评指正。

 

在此之前,先了解有行概念:“字符集”、“字符编码”和“内码”。

1、字符集及字符编码

字符是各种文字及标志的总称,包括各个国家文字、标点符号、图形符号、数字相当于。字符集是大半只字符的集结,字符集种类比较多,每个字符集包含的字符个数不同,常见字符集有:ASCII字符集、ISO
8859字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。计算机要规范的拍卖各种字符集文字,需要进行字符编码,以便计算机能够辨识以及存储各种文字。 

 

编码(encoding)和字符集不同。字符集只是字符的汇,不自然适合作网络传递、处理,有时要经过编码(encode)后才能够下。如Unicode可随不同得坐UTF-8、UTF-16、UTF-32等艺术编码。

 

字符编码就是盖二进制的数字来针对诺字符集的字符。

 

从而,对字符进行编码,是信交流之艺基础。

 

运什么字符。也就是说哪些汉字,字母和标记会叫收入标准被。所蕴含“字符”的聚合就叫做“字符集”。

规定每个“字符”分别用一个字节还是多只字节存储,用哪字节来囤积,这个确定虽称为“编码”。

 

逐一国家与地面在制订编码标准的时段,“字符的聚合”和“编码”一般还是还要制定的。因此,平常我们所说之“字符集”,比如:GB2312,
GBK, JIS 等,除了发“字符的集”这层意思外,同时也含有了“编码”的意思。

 

瞩目:Unicode字符集有多编码方式,如UTF-8、UTF-16等;ASCII只来平等栽;大多数MBCS(包括GB2312)也无非发同种。

2、什么是内码?

2.1 维基百科的解说

 

在微机对和有关领域中,内码指的凡“将消息编码后,透过某种方式储存在特定记忆装置时,装置中的编码形式”。在不同之系受,会产生差的内码。

当昔日的英文系受,内码为ASCII。在繁体中文系统被,目前常用之内码为非常五码(Big5)。在简体中文系统中,内码则也国标码(国家标准代码:现在强制要求祭GB18030标准;较旧计算机还是采用GB2312)。而统一码(Unicode)则为另外一样时不时表现内码。

 

2.2 百度百科的解说

 

内码是指完全系统受应用的次前进制字符编码,是关系输入、输出和网平台中间的交换码,通过内码可以达标通用和强效率传输文本的目的。比如MS
Word中所蕴藏和调用的虽是内码而休图形文字。英文ASCII字符采用一个字节的内码表示,中文字符如国标字符集中,GB2312、GB12345、GB13000皆用对字节内码,GB18030(27,533字)双字节内码汉字为20,902单,其余6,631单字用四字节内码。

3、字符编码分类总结

下面从计算机对几近国语言支持之角度来总结字符编码。

 

3.1 ASCII编码

 

以下来自“维基百科”:

ASCII(American Standard Code for Information
Interchange,美国音交互换标准代码)是因拉丁字母的等同拟电脑编码系统。它主要用来展示现代英语,而那个扩张版本EASCII则可以勉强显示其他西欧语言。它是今日最为通用的单字节编码系统(但是生被UniCode追上之征象),并一致于国际标准ISO/IEC
646。

ASCII第一差因标准标准的型态发表是当1967年,最后一软创新则是在1986年,至今为止共定义了128只字符;其中33独字符无法显示(这是以今天操作系统为依归,但以DOS模式下可显示有部分如笑脸、扑克牌花式等8-bit符号),且立即33单字符多数还早就是陈废的控制字符。控制字符的用要是为此来操控已经处理过之文字。在33只字符之外的凡95个可显示的字符,包含用键盘敲下空白键所来的空白字符也毕竟1个可显示字符(显示也空白)。

ASCII表:见http://zh.wikipedia.org/zh-cn/ASCII

 

ASCII缺点:

ASCII的最好要命弱点是只能显示26独基本拉丁字母、阿拉伯数目字和英式标点符号,因此只能用来展示现代美国英语(而且以拍卖英语中的西词如naïve、café、élite等等时,所有重音符号都只好去丢,即使这样做会违反拼写规则)。而EASCII虽然缓解了部份西欧语言的显得问题,但针对还多外语言还是束手无策。因此今之苹果电脑已经抛弃ASCII而更改用Unicode。

 

不过早的英文DOS操作系统的系统内码是:ASCII。计算机这时候才支持英语,其他语言不可知以处理器存储和显示。

 

以该阶段,单字节字符串使用一个字节存放一个字符(SBCS,Single Byte
Character System)。如:”Bob123″占6独字节。

 

3.2 ANSI编码

 

为而计算机支持更多语言,通常使用0x800~xFF范围之2个字节来代表1单字符。比如:汉字
‘中’ 在汉语言操作系统被,使用 [0xD6,0xD0]立即片个字节存储。

 

差之国和地区制定了不同之正儿八经,由此产生了GB2312,BIG5,JIS等个别的编码标准。这些下2单字节来表示一个字符的各种汉字延伸编码方式,称为
ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312
编码,在日文操作系统下,ANSI 编码代表 JIS 编码。

 

差 ANSI
编码之间互不兼容,当信息以列国中间交流时,无法用属于个别种语言的亲笔,存储于同一段
ANSI 编码的文件中。

 

华语DOS、中文/日文Windows 95/98时日系统内码使用的是ANSI编码(本地化)

 

每当使ANSI编码支持多语言等,每个字符使用一个字节或多独字节来代表(MBCS,Multi-Byte
Character
System),因此,这种方式存放的字符也叫称多配节约字符。比如,”中文123″
在国语 Windows 95
内存中为7单字节,每个字占2只字节,每个英文和数字字符占1个字节。

 

每当非 Unicode
环境下,由于不同国度同所在采取的字符集不平等,很可能出现无法正常显示有字符的景。微软公司下了代码页(Codepage)转换表的技能来过渡性的有缓解当下同题材,即经过点名的更换表将非
Unicode 的字符编码转换为同一字符对应之网之中以的 Unicode
编码。可以在“语言及区域设置”中挑选一个代码页作为非 Unicode
编码所用的默认编码方式,如936吗简体中文GBK,950呢楷体中文Big5(皆因PC上采取的)。在这种情况下,一些非英语的欧洲语言编写的软件及文档很可能出现乱码。而用代码页设置也对应语言中文处理又见面面世问题,这同样情景无法避免。从根本上说,完全使统一编码才是解决之道,但目前尚无法做到及时一点。

  代码页技术现在大也各种平台所祭。UTF-7 的代码页是65000,UTF-8
的代码页是65001。

 

3.3 Unicode编码

 

为要国际中间信息交流进一步惠及,国际团队制订了 UNICODE
字符集,为各种语言中的各个一个字符设定了合并以唯一的数字编号,以满足超过语言、跨平台进行文本转换、处理的求。

 

Unicode字符集可以简写为UCS(Unicode Character
Set)。早期的unicodeUnicode标准有UCS-2、UCS-4的说法。UCS-2据此简单个字节编码,UCS-4用4单字节编码。

 

在 UNICODE 被应用后,计算机存放字符串时,改也寄放每个字符在 UNICODE
字符集中的序号。目前电脑一般采用 2 只字节(16
位)来存放一个序号(DBCS,Double Byte Character
System),因此,这种艺术存放的字符也吃喻为宽字节字符。比如,字符串
“中文123” 在 Windows 2000 下,内存中实际存放的是 5
只序号,一共10独字节。

 

Unicode字符集包含了各种语言中使到的富有“字符”。用来吃 UNICODE
字符集编码的正规有诸多种,比如:UTF-8, UTF-7, UTF-16, UnicodeLittle,
UnicodeBig 等。

4、常用编码规则

4.1 单字节字符编码

 

(1)编码标准:ISO-8859-1。

(2)说明:最简易的编码规则,每一个字节直接作为一个 UNICODE
字符。比如,[0xD6, 0xD0] 这有限单字节,通过 iso-8859-1
转化为字符串时,将直得到 [0x00D6, 0x00D0] 两个 UNICODE 字符,即
“ÖД。

 

相反,将 UNICODE 字符串通过 iso-8859-1 转化为字节串时,只能够健康转化
0~255 范围的字符。

 

4.2 ANSI编码

 

(1)GB2312, BIG5, Shift_JIS, ISO-8859-2。

(2)把 UNICODE 字符串通过 ANSI
编码转化为“字节串”时,根据各自编码的确定,一个 UNICODE
字符可能转向成为一个字节或多个字节。

 

反之,将配节串转化成为字符串时,也说不定多个字节转化成为一个字符。比如,[0xD6,
0xD0] 这点儿独字节,通过 GB2312 转化为字符串时,将取 [0x4E2D]
一个字符,即 ‘中’ 字。

 

“ANSI 编码”的特点:

(1)这些“ANSI 编码标准”都只能处理各自语言范围里边的 UNICODE 字符。

(2)“UNICODE 字符”与“转换出来的字节”之间的涉是人工规定的。

 

4.3 UNICODE编码

 

(1)编码标准:UTF-8, UTF-16, UnicodeBig。

(2)与“ANSI 编码”类似之,把字符串通过 UNICODE
编码转化成为“字节串”时,一个 UNICODE 字符可能转化成为一个字节或多个字节。

 

同“ANSI 编码”不同的是:

(1)这些“UNICODE 编码”能够处理所有的 UNICODE 字符。

(2)“UNICODE 字符”与“转换出来的字节”之间是好透过测算得到的。

 

俺们其实并未必要去探讨每一样种编码具体将某部一个字符编码成了哪几单字节,我们就待理解“编码”的定义就是拿“字符”转化成为“字节约”就得了。对于“UNICODE
编码”,由于其是可由此测算得到的,因此,在非常之场地,我们得以去询问某平等栽“UNICODE
编码”是什么样的规则。

5、编码的区别

5.1 GB2312、GBK和GB18030

 

(1)GB2312 

 

当中国人们获取计算机时,已经没得应用的字节状态来表示汉字,况且有6000基本上个常因此汉字需要保留,于是想到将那些ASCII码中127声泪俱下后的奇异符号们一直注销掉,
规定:一个低于127的字符的义及原本一样,但简单个超127底字符连在一起时,就表示一个中国字,前面的一个字节(称之为高字节)从0xA1据此到0xF7,后面一个字节(低字节)从0xA1至0xFE,这样咱们就好整合产生大概7000大多独简体汉字了。在这些编码里,我们还将数学符号、罗马希腊之字母、日文的假名们都编上了,连于
ASCII
里当就有的数字、标点、字母都咸重新编了点滴单字节长的编码,这虽是常常说的”全角”字符,而原来在127号以下的那些不畏被”半比赛”字符了。这种汉字方案叫做
“GB2312″。GB2312 是针对 ASCII 的汉语扩展。兼容ASCII。

 

(2)GBK 

 

然中国之方块字太多矣,我们迅速即不怕发现出过多总人口之人名没有艺术在这里从出去,不得不连续将
GB2312
没有使的码位找出来用上。后来要么不够用,于是干脆不再要求没有字节一定是127如泣如诉之后的内码,只要第一单字节是高于127就稳表示马上是一个中国字的初步,不管后面与的凡未是扩大字符集里之情节。结果扩展之后的编码方案被称为
“GBK” 标准,GBK 包括了 GB2312
的拥有情节,同时还要充实了近乎20000个新的方块字(包括繁体字)和符号。

 

(3)GB18030 

 

后来少数民族也使因此计算机了,于是我们再度扩充,又加以了几千独新的少数民族的许,GBK
扩成了 GB18030。从此后,中华民族之学识就是可当微机时代中承受了。 

 

华夏底程序员们看看就等同系列汉字编码的专业是好的,于是通称他们叫做
“DBCS”(Double Byte Charecter Set
双许节字符集)。在DBCS系列标准里,最特别的特征是少数许节长的方块字字符和千篇一律配节长的英文字符并存于跟同模拟编码方案里,因此他们写的先后为支持中文处理,必须使留心字串里的各国一个字节的值,如果此价值是过127之,那么即便以为一个双字节字符集里的字符出现了。在这种场面下,”一个中国字毕竟少个英文字符!”。然而,在Unicode环境下可并非总是这么。 

 

5.1 Unicode和BigEndianUnicode

 

立马有限个指令存储顺序不同,如”A”的Unicode编码为6500,而BigEndianUnicode编码为0065。

 

5.2 UTF-7、UTF-8和UTF-16

 

以Unicode里,所有的字符被一视同仁。汉字不再行使“两个扩大ASCII”,而是以“1单Unicode”,注意,现在之字是“一个字符”了,于是,拆字、统计字数这些题目为即自然而然的缓解了。

 

不过,这个世界不是可以的,不容许当一夜之间所有的网都使用Unicode来处理字符,所以Unicode在出生之日,就必须考虑一个严峻的题材:和ASCII字符集之间的匪兼容问题。 

 

咱清楚,ASCII字符是单科字节的,比如“A”的ASCII是65。而Unicode是双字节底,比如“A”的Unicode是0065,这就是招致了一个深充分的问题:以前处理ASCII的那套机制不克叫用来处理Unicode了。

 

其它一个更是严重的问题是,C语言使用’\0’作为字符串结尾,而Unicode里恰恰有诸多字符都出一个字节为0,这样一来,C语言的字符串函数将无法正常处理Unicode,除非把世界上所有用C写的次序和她们所用之函数库全部换掉。

 

遂,比Unicode更了不起之东东落地了,之所以说它再宏大是因其给Unicode不再存在让纸上,而是实事求是的存吃我们大家之处理器被。那即便是:UTF。

 

UTF= UCS Transformation Format,即UCS转换(传输)格式。

它是以Unicode编码规则和计算机的骨子里编码对应起来的一个条条框框。现在风行的UTF有2种植:UTF-8和UTF-16。

 

马上简单栽都是Unicode的编码实现。

 

5.2.1 UTF-8

 

UCS-2编码(16进制)   UTF-8 字节流(二进制)

0000 – 007F         0xxxxxxx

0080 – 07FF         110xxxxx 10xxxxxx

0800 – FFFF         1110xxxx 10xxxxxx 10xxxxxx 

 

譬如说“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以自然要为此3字节模板了:1110xxxx
10xxxxxx 10xxxxxx。将6C49描写成二进制是:0110 110001
001001,用此于特流依次代替模板被之x,得到:11100110 10110001
10001001,即E6 B1 89。

 

可见UTF-8凡是易长的,将Unicode编码为00000000-0000007F底字符,用么字节来表示;
00000080-000007FF之字符用鲜只字节表示;00000800-0000FFFF的许符用3字节表示。因为目前为止Unicode-16规范没有点名FFFF以上之字符,所以UTF-8最多是使用3个字节来代表一个字符。但辩解及来说,UTF-8最多用用6字节代表一个字符。 

 

UTF-8兼容ASCII。

 

5.2.2 UTF-16(标准的Unicode成为UTF-16)

 

UTF-16与地方提到的Unicode本身的编码规范是相同的。

 

UTF-16因16各类也单元对UCS进行编码。对于小于0x10000的UCS码,UTF-16编码就等于UCS码对应的16个无符号整数。对于未小于0x10000底UCS码,定义了一个算法。不过由于实在运用的UCS2,或者UCS4的BMP必然小于0x10000,所以便时而言,可以看UTF-16和UCS-2基本相同。但UCS-2只是一个编码方案,UTF-16却只要用以实际的传导,所以尽管不得不考虑配节序的题材。

 

UTF-16不兼容ASCII。

 

5.2.3 UTF-7

 

UTF-7 (7-个元 Unicode 转换格式(Unicode Transformation Format,简写成
UTF)) 是一模一样种植而换长字元编码方式,用以将 Unicode 字初盖 ASCII
编码的字正串来表现,可以用在电子邮件传输之类的利用。

 

UTF-7并非Unicode标准有。想使详细了解之好翻相关资料。

6、Unicode与UTF

Unicode是内存编码表示方案(是专业),而UTF是何等保存与传导Unicode的方案(是落实)。

 

6.1 UTF的配节序和BOM

 

6.1.1 字节序

 

UTF-8以字节为编码单元,没有许节序的题材。UTF-16为有限独字节为编码单元,在解释一个UTF-16和平以前,首先要弄明白每个编码单元的许节序。例如收到一个“奎”的Unicode编码是594E,“乙”的Unicode编码是4E59。如果我们收起UTF-16配节流“594E”,那么这是“奎”还是“乙”?

 

Unicode规范着推介的标记字节顺序的法子是BOM。BOM不是“Bill Of
Material”的BOM表,而是Byte Order Mark。BOM是一个生接触小智慧的想法:

 

以UCS编码中发出一个叫做”ZERO WIDTH NO-BREAK
SPACE”的字符,它的编码是FEFF。而FFFE在UCS中凡是未有的字符,所以无应出现于事实上传输中。UCS规范建议我们当传输字节约流前,先招输字符”ZERO
WIDTH NO-BREAK SPACE”。

 

如此这般如果接收者收到FEFF,就标志这个字节流是Big-Endian的;如果接FFFE,就表明是字节流是Little-Endian的。因此字符”ZERO
WIDTH NO-BREAK SPACE”又为称BOM。

 

UTF-8不待BOM来表明字节顺序,但好据此BOM来表明编码方式。字符”ZERO WIDTH
NO-BREAK SPACE”的UTF-8编码是EF BB
BF(读者可用我们前介绍的编码方法验证一下)。所以若接收者收到以EF
BB BF开头的字节流,就理解就是UTF-8编码了。

 

6.1.2 BOM

 

(1)BOM的来历 

 

为了鉴别 Unicode 文件,Microsoft 建议所有的 Unicode 文件应当为 ZERO
WIDTH NOBREAK
SPACE(U+FEFF)字符开头。这看做一个“特征相符”或“字节约顺序记(byte-order
mark,BOM)”来分辨文件中利用的编码和字节顺序。

 

(2)不同的系对BOM的支撑 

 

因有的网或程序不支持BOM,因此带有BOM的Unicode文件有时见面带有题目。

 

①JDK1.5和前的Reader都无可知处理带有BOM的UTF-8编码的文件,解析这种格式的xml文件时,会丢弃来大:Content
is not allowed in
prolog。“对于化解方式,之后我会写首文章特别讨论该问题。”

 

②Linux/UNIX 并不曾用 BOM,因为它见面损坏现有的 ASCII 文件之语法约定。

 

③异之修工具对BOM的拍卖呢各不相同。使用Windows自带的记事本将文件保留也UTF-8编码的早晚,记事本会自动在文件开始插入BOM(虽然BOM对UTF-8来说并无是须的)。而其余众多编辑器用不用BOM是好选的。UTF-8、UTF-16都是这样。

 

(3)BOM与XML 

 

XML解析读取XML文档时,W3C定义了3漫长规则:

 

①如果文档中发出BOM,就定义了文件编码;

②只要文档中从来不BOM,就翻XML声明中之编码属性;

③假设上述二者都无,就假定XML文档采用UTF-8编码。

 

6.2 决定文本的字符集及编码

 

软件通常有三栽途径来支配文本的字符集及编码。

 

(1)对于Unicode文本最规范的途径是检测文本最初步的几乎独字节。如:

 

始于字节        Charset/encoding

 EF BB BF    UTF-8

 FE FF     UTF-16/UCS-2, little endian(UTF-16LE)

 FF FE     UTF-16/UCS-2, big endian(UTF-16BE)

 FF FE 00 00  UTF-32/UCS-4, little endian.

 00 00 FE FF  UTF-32/UCS-4, big-endia

 

(2)采取同样种植比较安全之方来控制字符集及其编码,那便是弹来一个会话框来请示用户。

 

唯独MBCS文本(ANSI)没有这些身处开头的字符集标记,现在多软件保存文本也Unicode时,可以选是否保存这些身处开头的字符集标记。因此,软件无应当乘让这种路径。这时,软件可以采取一致栽于安全的道来决定字符集及其编码,那就算是弹有一个对话框来请示用户。

 

(3)采取自己“猜”的方法。

 

如果软件不思量麻烦用户,或者它们不便利为用户请示,那她不得不采用协调“猜”的道,软件可根据所有文件的特色来怀疑其恐怕属于哪个charset,这就算充分可能禁止了。使用记事本打开那个“联通”文件就属这种状况。(把原属于ANSI编码的公文正是UTF-8处理,详细说明见:http://blog.csdn.net/omohe/archive/2007/05/29/1630186.aspx)

 

6.3 记事本的几乎栽编码

 

(1)ANSI编码 

记事本默认保存的编码格式是:ANSI,即地面操作系统默认的内码,简体中文一般也GB2312。这个怎么验证呢?用记事本保存后,使用EmEditor、EditPlus和UltraEdit之类的文本编辑器打开。推荐应用EmEditor,打开后,在以下角会显示编码:GB2312。

 

(2)Unicode编码 

故记事本另存为时,编码选择“Unicode”,用EmEditor打开该文件,发现编码格式是:UTF-16LE+BOM(有签署)。用十六进制方式查看,发现开头两许节为:FF
FE。这就算是BOM。

 

(3)Unicode big endian 

因此记事本另存为时,编码选择“Unicode”,用EmEditor打开该文件,发现编码格式是:UTF-16BE+BOM(有签约)。用十六进制方式查看,发现开头两许节为:FE
FF。这便是BOM。

 

(4)UTF-8 

就此记事本另存为时,编码选择“UTF-8”,用EmEditor打开该公文,发现编码格式是:UTF-8(有署名)。用十六进制方式查看,发现开头三个字节为:EF
BB BF。这即是BOM。

7、几种误解,以及乱码产生的来由以及解决办法

7.1 误解一

 

以将“字节串”转化成为“UNICODE
字符串”时,比如以读取文本文件时,或者通过网传输文本时,容易用“字节串”简单地看成单字节字符串,采用每“一个字节”就是“一个字符”的办法进行中转。

 

若果实际,在非英文的条件中,应该以“字节串”作为 ANSI
字符串,采用适当的编码来获取 UNICODE
字符串,有或“多单字节”才能够得到“一个字符”。

 

一般性,一直以英文环境下举行开发的程序员们,容易产生这种误解。

 

7.2 误解二

 

每当 DOS,Windows 98 等非 UNICODE 环境下,字符串都是为 ANSI
编码的字节形式是的。这种为字节形式存在的字符串,必须理解凡是哪种编码才会为科学地动用。这如果我们形成了一个惯性思维:“字符串的编码”。

 

当 UNICODE 被支持后,Java 中的 String
是为字符的“序号”来囤积的,不是坐“某种编码的字节”来储存的,因此就休存在“字符串的编码”这个概念了。只有当“字符串”与“字节串”转化时,或者,将一个“字节串”当成一个
ANSI 字符串时,才发编码的定义。

 

诸多之食指犹产生夫误会。

 

7.3 分析和解决

 

第一栽误解,往往是招乱码产生的原故。第二种误解,往往造成本好改的乱码问题易得再扑朔迷离。

 

以这里,我们可见见,其中所摆的“误解一”,即以每“一个字节”就是“一个字符”的转发方法,实际上为即相同于采用
iso-8859-1 进行中转。因此,我们常用 bytes =
string.getBytes(“iso-8859-1”)
来展开逆向操作,得到原始之“字节串”。然后再使用对的 ANSI 编码,比如
string = new String(bytes, “GB2312”),来获得不错的“UNICODE 字符串”。

8、参考和尖锐阅读学习材料

8.1 《字符,字节和编码》http://www.regexlab.com/zh/encoding.htm(强烈推荐)

8.2 《关于编码: ascii(ansi), gb-2312, unicode,
utf8》http://blog.csdn.net/omohe/archive/2007/05/29/1630186.aspx

8.3 《Ansi,UTF8,Unicode,ASCII编码的界别》http://hi.baidu.com/%D6%F0%C4%BE/blog/item/772c5944d5e77e8bb3b7dcab.html

8.4 百度百科《Unicode》http://baike.baidu.com/view/40801.htm

8.5 《Unicode与UTF-8/UTF-16之间有吗关系或界别?》http://zhidao.baidu.com/question/52532619.html?fr=ala0

 

出处:http://polaris.blog.51cto.com/1146394/377468

相关文章

No Comments, Be The First!
近期评论
    文章归档
    功能
    网站地图xml地图