Word中ASCII和ANSI以及Unicode字符知识是什么
Word文档中我们需要了解很多字符串的知识,比如ASCII、ANSI和Unicode等字符知识。掌握这些字符对于文档操作,有不少帮助。以下是学习啦小编为您带来的关于Word中ASCII、ANSI和Unicode字符知识,希望对您有所帮助。
Word中ASCII、ANSI和Unicode字符知识
1. ASCII 字符
ASCII 码的全称是American Standard Code for Information Interchange(美国信息互换标准代码),使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。
标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的数字、大小写字母、英文标点符号,以及一些特殊的控制字符。
后128个称为扩展ASCII码。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。
ASCII 字符可用通过Word的菜单命令【插入】/【符号】中,来自“ASCII(十进制)”/“ASCII(十六进制)”。
注:在Word的查找替换中,一个ASCII字符可用^nnn来表示,范围是1~128,比如:字母X,可表示为^88。
另外,某些ASCII控制字符(即不能显示的字符,如:制表符、回车符),被赋予了特殊的含义,而不再代表一个字符。
标准ASCII字符集
代码 | 说明 | 代码 | 说明 | 代码 | 说明 |
1 | 嵌入式图形 | 44 | , | 87 | W |
2 | 脚注标记 | 45 | - | 88 | X |
3 | 46 | . | 89 | Y | |
4 | 47 | / | 90 | Z | |
5 | 48 | 0 | 91 | [ | |
6 | 49 | 1 | 92 | \ | |
7 | 表格竖线 | 50 | 2 | 93 | ] |
8 | 退格键 | 51 | 3 | 94 | ^ |
9 | 制表符 | 52 | 4 | 95 | _ |
10 | 换行符 | 53 | 5 | 96 | ` |
11 | 手动换行符 | 54 | 6 | 97 | a |
12 | 分页符或分节符 | 55 | 7 | 98 | b |
13 | 回车符 | 56 | 8 | 99 | c |
14 | 分栏符 | 57 | 9 | 100 | d |
15 | 58 | : | 101 | e | |
16 | 59 | ; | 102 | f | |
17 | 60 | < | 103 | g | |
18 | 61 | = | 104 | h | |
19 | 左侧域标志 | 62 | > | 105 | i |
20 | 63 | ? | 106 | j | |
21 | 右侧域标志 | 64 | @ | 107 | k |
22 | 65 | A | 108 | l | |
23 | 66 | B | 109 | m | |
24 | 67 | C | 110 | n | |
25 | 68 | D | 111 | o | |
26 | 69 | E | 112 | p | |
27 | 70 | F | 113 | q | |
28 | 71 | G | 114 | r | |
29 | 72 | H | 115 | s | |
30 | 73 | I | 116 | t | |
31 | 74 | J | 117 | u | |
32 | 半角空格 | 75 | K | 118 | v |
33 | ! | 76 | L | 119 | w |
34 | " | 77 | M | 120 | x |
35 | # | 78 | N | 121 | y |
36 | $ | 79 | O | 122 | z |
37 | % | 80 | P | 123 | { |
38 | & | 81 | Q | 124 | | |
39 | ' | 82 | R | 125 | } |
40 | ( | 83 | S | 126 | ~ |
41 | ) | 84 | T | 127 | |
42 | * | 85 | U | 128 | € |
43 | + | 86 | V |
2. ANSI字符
为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示1个字符。比如:汉字“中”在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。
不同的国家和地区制定了不同的标准,由此产生了GBK(简体中文), BIG5(繁体中文),JIS(日语)等各自的编码标准。这些使用2个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文操作系统下,ANSI 编码代表GBK编码。扩展ASCII 码可视为英文系统下的ANSI字符集。
注:在Word的查找替换中,一个ANSI字符可用^0nnn来表示,范围是1~255。比如:字母X,可表示为^088。另外,ANSI Character并不代表GBK字符,而似乎和扩展ASCII码相同。
3. Unicode字符
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换和处理的要求。
Unicode字符可用通过Word的菜单命令【插入】/【符号】中,选择“Unicode(十六进制)”即可。常用汉字(CJK统一汉字)的范围是4E00~9FA5(一~龥),因此,通配符“[一-龥]”可以表示一个汉字。
注:在Word的查找替换中,一个Unicode字符可用^Unnnn来表示(关闭“使用通配符”选项),比如:中国,可表示为^u20013^u22269。不支持16进制表达。
猜你喜欢: