必赢亚洲手机app下载


周边字符集及编码

字符函数电脑软件

单行函数电脑软件

http://docs.oracle.com/cd/B28359_01/server.111/b28286/functions001.htm#autoId2

 

本文内容

  • NLS 字符函数
  • 附录

Oracle 字符函数包含:

 

再次回到数字值的字符函数

回来数字值的函数可以把此外字符类型作为其参数。它概括:ASCIIINSTRLENGTH
REGEXP_INSTR

ASCII

INSTR

LENGTH

REGEXP_INSTR

 

ASCII(char)

ASCII 函数重临 char 第二个字符的数据库字符集的十进制表示。
char 能够是数据类型 CHARVARCHAR2NCHAR
NVARCHAR2。重回值是 NUMBER 类型。若您的数据库字符集是 7 位
ASCII ,则该函数重返 ASCII 值;若数据库字符集是 EBCDIC
编码,则赶回一个 EBCDIC 值。其余,没有对应的 EBCDIC
字符函数。
该函数不直接匡助 CLOB 数据。然则,CLOB
数据可以隐式数据转换作为参数传递。

示例 4:演示 ASCII。重临 employees 表中字段 last names 以字母 L
初阶的笔录,L 的 ASCII 等价于 76。employees 表位于 Oracle OE schema。

SQL> SELECT last_name FROM employees WHERE ASCII(SUBSTR(last_name, 1, 1)) = 76;

 

LAST_NAME

-------------------------

Lorentz

Landry

Ladwig

Lee

Livingston

 

SQL>

 

INSTR(string,substring)
INSTR(string,substring,position)
INSTR(string,substring,position,occurrence)
INSTRB(string,substring)
INSTRB(string,substring,position)
INSTRB(string,substring,position,occurrence)
INSTRC(string,substring)
电脑软件,INSTRC(string,substring,position)
INSTRC(string,substring,position,occurrence)
INSTR2(string,substring)
INSTR2(string,substring,position)
INSTR2(string,substring,position,occurrence)
INSTR4(string,substring)
INSTR4(string,substring,position)
INSTR4(string,substring,position,occurrence)
REGEXP_INSTR(source_char,pattern)
REGEXP_INSTR(source_char,pattern,position)
REGEXP_INSTR(source_char,pattern,position,occurence)
REGEXP_INSTR(source_char,pattern,position,occurence,return_opt)
REGEXP_INSTR(source_char,pattern,position,occurence,return_opt,match_param)
REGEXP_INSTR(source_char,pattern,position,occurence,return_opt,match_param,subexpr)

INSTR 函数在 string 中检索
substring。该函数再次回到一个整数,提醒 substring
string 中首先个极度的地点。INSTR
利用由输入字符集自定义的字符计算字符串。INSTRB
使用字节,而不是字符。INSTRC 使用 Unicode 完整字符(Unicode
complete characters)。INSTR2 使用 UCS2 编码点(UCS2 code
points)。INSTR4 使用 UCS4 编码点(UCS4 code points)。

  • position 是非零整数,提示 Oracle 数据库检索 string
    中字符的开端地方。若 position 为负数,则 Oracle 从
    string 末尾向后初叶盘算,并摸索。
  • occurrence 是整数,提示 Oracle 检索怎样产生。occurrence
    必须为正数。若 occurrence 大于 1,则数据库在 string 的第
    occurrence 次检索到时回来。

stringsubstring 可以是随机数据类型
CHARVARCHAR2NCHARNVARCHAR2CLOB
NCLOB。重回值为 NUMBER 数据类型。

positionoccurrence 必须是 NUMBER
类型,或是任何可以隐式转换成 NUMBER
的数据类型,并必须解析为整数。positionoccurrence
的默许值为 1,意味着,Oracle 从 string
第三个字符开首摸索,substring 首回搜索到时暴发。重临值时绝对于
string 的上马地点,而不是抵触于
position。若检索不成事,则赶回 0。

REGEXP_INSTR 函数是 INSTR 函数关于正则表明式的恢弘函数。

示例 5:演示 INSTR。

SQL> SELECT INSTR('CORPORATE FLOOR', 'OR') "Instring1",

  2         INSTR('CORPORATE FLOOR', 'OR', 3, 2) "Instring2",

  3         INSTR('CORPORATE FLOOR', 'OR', -3, 2) "ReversedInstring"

  4    FROM DUAL;

 

 Instring1  Instring2 ReversedInstring

---------- ---------- ----------------

         2         14                2

 

SQL>

 

LENGTH(char)
LENGTHB(char)
LENGTHC(char)
LENGTH2(char)
LENGTH4(char)

LENGTH 函数再次来到 char
的尺寸。该函数利用由输入字符集定义字符的长短。LENGTHB
使用字节,而不是字符。LENGTHC 使用 Unicode 完整字符(Unicode
complete characters)。LENGTH2 使用 UCS2 编码点(UCS2 code
points)。LENGTH4 使用 UCS4 编码点(UCS4 code points)。

char 可以是
CHARVARCHAR2NCHARNVARCHAR2CLOB
NCLOB 的随意档次。再次回到值是 NUMBER 类型。若 char
CHAR 类型,则长度包罗拥有空白。若 charnull,则返回
null

LENGTHB 函数的限定:该函数仅扶助单字节的
LOB。不可能用在多字节字符节的 CLOB 和 NCLOB 数据上。

示例 6:演示 LENGTH。

SQL> SELECT LENGTH('CANDIDE') "Length in charactoers"

  2  FROM DUAL;

 

Length in charactoers

---------------------

                    7

 

SQL>

EBCDIC

EBCDIC(Extended Binary Coded Decimal Interchange
Code,广义二进制编码的十进制互换码,读作 “ehb-suh-dik” 或
“ehb-kuh-dik”)是 IBM 于1963 年- 64
年代生产的字符编码表,根据中期打孔机式的二进化十进数(Binary Coded
Decimal,BCD)排列而成。

EBCDIC 是 IBM 为它更大型的操作系统而支出。在一个 EBCDIC
文件里,每个字符(字母或数字)被代表为一个 8 位的二进制。而 IBM
个人计算机和工作站不行使它们的 EBCDIC 编码,而是工业标准编码 ASCII
码。

EBCDIC
缺点是英文字母不是三番五次地排列,中间现身数次断断续续,为编写程序的人带来了部分辛劳。

UCS

UCS(Universal Character Set/Universal Multiple-Octet Coded Character
Set,通用字符集)由 ISO 制定(ISO 10646 或 ISO/IEC 10646、ISO/IEC
10646-1、ISO/IEC 10646-2)。

UCS 包涵所有其余字符集,保险与其余字符集的双向包容。UCS
包罗已知语言的兼具字符。除拉丁语、爱沙尼亚语、斯拉夫语、英语、土耳其语、亚美尼亚语、格鲁吉亚语,还包含粤语、日文、阿拉伯语那样的方框文字,以及多量的图片、印刷、数学、科学符号。

Unicode

Unicode(统一码、万国码、单一码、标准万国码)是电脑世界的业界规范。它对社会风气上半数以上的文字系统进行了整理和编码,使电脑可以更为简化地突显和拍卖文字。

Unicode 随通用字符集(Universal Character
Set,UCS)标准而进步。Unicode
一向在不断创新,每个新本子都进入越多的新字符。Unicode
涵盖了除字形、编码方法、标准字符编码外,还包罗字符特性,如大小写字母。

Unicode 由非营利机构——统一码联盟负责,致力于让 Unicode
取代既有的字符编码方案。因为,它们空间有限,不适用于多语环境。因而,Unicode
备受肯定,并广泛地运用于电脑软件的国际化与本地化过程。

Unicode 与 UCS

正史上存在四个单身的尝尝创设单一字符集的集体,即 ISO
和联合码联盟,由此早期制定了不一样的规范。1991
年,五个项目标参预者都认识到,世界不需求四个不包容的字符集。于是,开始合营,两者都允许保持码表包容,并紧密地一同调整其余未来的壮大。

Unicode 标准包括了 ISO/IEC 10646-1 完毕级别 3
的中坚多文种平面。五个正经的所有字符都在同一的义务并且有同一的名字。ISO/IEC
10646 只可是是一个概括的字符集表。而 Unicode
标准,额外定义了成百上千与字符有关的语义符号学。Unicode
使用进一步广阔。但一般认为,用于打印 ISO/IEC 10646-1
标准的书体在少数地点的质料,要当先 Unicode。

UTF-8 和 UTF-16

UTF-8(8-bit Unicode Transformation Format)是一种针对 Unicode
可变长度字符编码,也是一种前缀码。可以用来代表 Unicode
标准中的任何字符,且其编码中的第四个字节与 ASCII
包容。因而,它逐渐改为电子邮件、网页及其余储存或传递文字的施用中,优先选择的编码。

UTF-8 使用一到七个字节为各样字符编码:

  • 128 个 ASCII 字符只需一个字节编码(Unicode 范围 U+0000 – U+007F)
  • 富含附加符号的拉丁文、希腊文、西乌特勒支字母、亚美尼亚语、希伯来文、阿拉伯文、叙雷克雅未克文及它拿字母,则需求二个字节编码(Unicode
    范围 U+0080 – U+07FF)
  • 其他基本多文种平面(BMP)的字符(包罗一大半常用字)使用多个字节编码
  • 此外极少使用的 Unicode 援助平面的字符使用四字节编码。

对上边的第四种字符而言,UTF-8 就像太花费资源。

但 UTF-8 对所有常用的字符都足以用八个字节表示——UTF-16
编码。对第四种字符同样须要七个字节来编码,所以,是 UTF-8
更有功用,如故UTF-16,视所使用字符的遍布范围而定。然而,若使用部分减小系统,如
deflate,则那几个不一样编码系统间的歧异就不足挂齿了。若顾及传统压缩算法在削减较短文字上的效果不大,可以设想动用
Unicode 标准压缩格式(SCSU)。

互联网工程工作小组(IETF)要求所有互联网协议都必须帮衬 UTF-8
编码。互联网邮件联盟(IMC)建议持有电子邮件软件都协理UTF-8 编码。

ASCII

ASCII(American Standard Code for Information
Interchange,米国音信调换标准代码,读作 ˈæski’ 或
ASS-kee)是根据拉丁字母的一套编码系统,国际标准 ISO/IEC
646。首要用以呈现现代葡萄牙语,其增添版本EASCII
则足以勉强突显其余西欧语言。ASCII 是明日最通用的单字节编码系统,但有被
Unicode取代的马迹蛛丝。

电脑软件 1

电脑软件 2

相关文章

No Comments, Be The First!
近期评论
    功能
    网站地图xml地图