ll码表

在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机比较傻,只有0和1两位数的二进制比较适合于它使用),同样的,象a、b、c、d这样的52个字母(包括大写)、以及0、1、2等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪个数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通讯而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了所谓的ASCII编码,统一规定了上述常用符号用哪个二进制数来表示。

美国标准信息交换代码是由美国国家标准学会(American National Standard Institute , ANSI)制定的,标准的单字节字符编码方案,用于基于文本的数据。起始于50年代后期,在1967年定案。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,它已被国际标准化组织(InternationalOrganization for Standardization, ISO)定为国际标准,称为ISO646标准。适用于所有拉丁文字字母。ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号,以及在美式英语中使用的特殊控制字符。其中:0~32及127(共34个)是控制字符或通讯专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和 13分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

33~126(共94个)是字符,其中48~57为0到9十个阿拉伯数字;65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

后128个称为扩展ASCII码,目前许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展 ASCII码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。以下为标准ASCII表:

BinDecHex缩写/字符解释0000 0000000NUL(null)空字符0000 0001101SOH (start ofhanding)标题开始0000 0010202STX (start oftext)正文开始0000 0011303ETX (end oftext)正文结束0000 0100404EOT (end oftransmission)传输结束0000 0101505ENQ(enquiry)请求0000 0110606ACK(acknowledge)收到通知0000 0111707BEL(bell)响铃0000 1000808BS(backspace)退格0000 1001909HT (horizontaltab)水平制表符0000 1010100ALF (NL line feed, newline)换行键0000 1011110BVT (verticaltab)垂直制表符0000 1100120CFF (NP form feed, newpage)换页键0000 1101130DCR (carriagereturn)回车键0000 1110140ESO (shiftout)不用切换0000 1111150FSI (shiftin)启用切换0001 00001610DLE (data linkescape)数据链路转义0001 00011711DC1 (device control1)设备控制10001 00101812DC2 (device control2)设备控制20001 00111913DC3 (device control3)设备控制30001 01002014DC4 (device control4)设备控制40001 01012115NAK (negativeacknowledge)拒绝接收0001 01102216SYN (synchronousidle)同步空闲0001 01112317ETB (end of trans.block)传输块结束0001 10002418CAN(cancel)取消/作废0001 10012519EM (end ofmedium)介质中断0001 1010261ASUB(substitute)替补0001 1011271BESC(escape)溢出0001 1100281CFS (fileseparator)文件分割符0001 1101291DGS (groupseparator)分组符0001 1110301ERS (recordseparator)记录分离符0001 1111311FUS (unitseparator)单元分隔符

0010 00003220空格0010 00013321!0010 00103422"0010 00113523#0010 01003624$0010 01013725%0010 01103826&0010 01113927'0010 10004028(0010 10014129)0010 1010422A*0010 1011432B+0010 1100442C,0010 1101452D-0010 1110462E.0010 1111472F/0011 0000483000011 0001493110011 0010503220011 0011513330011 0100523440011 0101533550011 0110543660011 0111553770011 1000563880011 1001573990011 1010583A:0011 1011593B;0011 1100603C<0011 1101613D=0011 1110623E>0011 1111633F?0100 00006440@

0100 00016541A0100 00106642B0100 00116743C0100 01006844D0100 01016945E0100 01107046F0100 01117147G0100 10007248H0100 10017349I0100 1010744AJ0100 1011754BK0100 1100764CL0100 1101774DM0100 1110784EN0100 1111794FO0101 00008050P0101 00018151Q0101 00108252R0101 00118353S0101 01008454T0101 01018555U0101 01108656V0101 01118757W0101 10008858X0101 10018959Y0101 1010905AZ0101 1011915B[0101 1100925C\0101 1101935D]0101 1110945E^0101 1111955F_0110 00009660`

0110 00019761a0110 00109862b0110 00119963c0110 010010064d0110 010110165e0110 011010266f0110 011110367g0110 100010468h0110 100110569i0110 10101066Aj0110 10111076Bk0110 11001086Cl0110 11011096Dm0110 11101106En0110 11111116Fo0111 000011270p0111 000111371q0111 001011472r0111 001111573s0111 010011674t0111 010111775u0111 011011876v0111 011111977w0111 100012078x0111 100112179y0111 10101227Az0111 10111237B{0111 11001247C|0111 11011257D}0111 11101267E~

0111 11111277FDEL(delete)删除另外还有128-255的ASCII字符字符集简史6000年前 象形文字3000年前 字母表1838年到1854年 Samuel F. B. Morse发明了电报,字母表中的每个字符对应于一系列短的和长的脉冲1821年到1824年 Louis Braille发明盲文,6位代码,它把字符、常用字母组合、常用单字和标点进行编码。一个特殊的escape代码表示后续的字符代码应解释为大写。一个特殊的shift代码允许后续代码被解释为数字。1931年 CCITT标准化Telex代码,包括Baudot #2的代码,都是包括字符和数字的5位代码。1890年 早期计算机的字符码是从Hollerith卡片,6位字符码系统BCDIC(Binary-Coded DecimalInterchange Code:二进制编码十进制交换编码)60年代 扩展为8位EBCDIC,IBM大型主机的标准1967年 美国信息交换标准码(ASCII:American Standard Code for InformationInterchange)在字符长度是6位、7位还是8位的问题上产生了很大的争议。从可靠性的观点来看不应使用替换字符,因此ASCII不能是6位编码,但由于费用的原因也排除了8位版本的方案(当时每位的储存空间成本仍很昂贵)。这样,最终的字符码就有26个小写字母、26个大写字母、10个数字、32个符号、33个句柄和一个空格,总共128个字符码。ASCII现在记录在ANSI X3.4-1986字符集-用于信息交换的7位美国国家标准码(7-Bit ASCII:7-BitAmerican NationalStandard Code for Information Interchange),由美国国家标准协会(AmericanNational Standards Institute)发布。

ASCII国际问题

ASCII是美国标准,所以它不能良好满足其它讲英语国家的需要。例如英国的英镑符号(£)在哪里?拉丁语字母表重音符号,使用斯拉夫字母表的希腊语、希伯来语、阿拉伯语和俄语。汉字系统的中国象形汉字,日本和朝鲜。

1967年,国际标准化组织(ISO:International StandardsOrganization)推荐一个ASCII的变种,代码0x40、0x5B、0x5C、0x5D、0x7B、0x7C和0x7D“为国家使用保留”,而代码0x5E、0x60和0x7E标为“当国内要求的特殊字符需要8、9或10个空间位置时,可用于其它图形符号”。这显然不是一个最佳的国际解决方案,因为这并不能保证一致性。但这却显示了人们如何想尽办法为不同的语言来编码的。

双字节字符集双字节字符集(DBCS:double-byte characterset),解决中国、日本和韩国的象形文字符和ASCII的某种兼容性。DBCS从256代码开始,就像ASCII一样。与任何行为良好的代码页一样,最初的128个代码是ASCII。然而,较高的128个代码中的某些总是跟随着第二个字节。这两个字节一起(称作首字节和跟随字节)定义一个字符,通常是一个复杂的象形文字。

THE END
0.AIM1ArabicAlphabet阿拉伯语字母表.pdfAIM 1 Arabic Alphabet 阿拉伯语字母表.pdf 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 VIP免费下载 收藏 分享赏 0 下载提示 1、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。 2、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。 jvzquC41oc~/dxtm33>/exr1jvsm1;53:1643B4379>7:?860unuo
1.阿拉伯语发音这是一款阿拉伯字母和发音学习与训练的专业工具,可以有效地纠正阿拉伯语的发音问题。 这款应用具有以下特色: • 包含了28个阿拉伯字母和所有标准的阿拉伯语语音音素(静音、短音、长音、软音、鼻音) • 使用发音器官动画演示了基本音素发音的过程和技巧 • 使用笔顺动画演示每个阿拉伯字母的书写顺序jvzquC41crvt0jurng4dqv4ep1gqr8*G;'?9'KK'G8+9D.=;'G:&DL*CH'K9'JK'CF+F7.=H';7&GB*;H'H4/.J7'CJ&C?*G6'H:'J5'G;+::.GH'G<&:K*:;'K5'KH'CH+F:.FH'CJ&G>*CF'?8'N;'CH+9F.J7';L&DJ*G9'G2'A5'G7+9H.>3'G?&;O*D5'K7'J5':9+F7.=9':<&G>*:7'G6'N>';9+B:.J8';;&;B*G9'G9'AG1kf71:A<54778AuBxk