ython零基础入门篇①⑧字符串的编码格式腾讯云开发者社区

是不是有些晦涩难懂?其实我也这么觉得,我们不妨举个例子。

在抗日战争时期,在战场的情报传递中,为了不让地方获取我方的军事信息,往往需要通讯兵利用电报的方式传递情报信息。电报是将情报信息转化为一定规则的哒哒声,然后通过密码本再解码为书面文字形式的情报。而不知道这种规则与对应的解码密码本就不知道这种哒哒声代表的什么意思。

编码格式也是一样的,它是有一定规则的规则,使用了这种规则,我们就知道传输的是什么意思。

学计算机的都知道,计算机是以二进制的形式来存储数据的,即它只认识 0 和 1 两个数字。

在计算机发展的早期,美国作为计算机领域的No.1 ,它制定了一套编码标准(ASCII 码),解决了 128 个英文字符与二进制之间的对应关系。

虽然英语用 128 个字符编码已经够用,但使用计算机的国家有很多,如果想表示其他语言,128 个符号显然不够用,所以很多其他国家都在 ASCII 的基础上发明了很多别的编码,例如包含了汉语简体中文格式的 GB2312 编码格式(使用 2 个字节表示一个汉字)。也正是由于出现了很多种编码格式,导致了“文件显示乱码”的情况。于是 Unicode 字符集便应运而生。

Unicode 字符集又称万国码、国际码、统一码等,Unicode 对世界上大部分的文字系统进行了整理、编码,使得电脑可以用更简单的方式来呈现和处理文字。

Unicode 字符集可以使用的编码方案有三种,分别是:

UTF-8

一种变长的编码方案,使用 1~6 个字节来存储

UTF-16

介于 UTF-8 和 UTF-32 之间,使用 2 个或者 4 个字节来存储,长度既固定又可变

UTF-32

一种固定长度的编码方案,不管字符编号大小,始终使用 4 个字节来存储

==其中,UTF-8 是目前使用最广的一种 Unicode字符集的实现方式,可以说它几乎已经一统江湖了。==

Python 3.x 中,字符串采用的是 Unicode 字符集,可以用如下代码来查看当前环境的编码格式:

同时,在 Python 3.x 中也可以用 ord() 和 chr() 函数实现字符和编码数字之间的转换,例如:

由此可以知道,在 Unicode 字符集中,字符‘Q’对应的编码数字为 81,而中文‘网’对应的编码数字为 32593。

值得一提的是,虽然 Python 默认采用 UTF-8 编码,但它也提供了 encode() 方法,可以轻松实现将 Unicode 编码格式的字符串转化为其它编码格式。

编码的作用就是对某一种语言的解析识别,也可以说是一种标准。如果在Python中定义错了编码格式,可能就会出现错误,在国内使用通用的

UTF-8 的类型,就可以让我们在脚本中即可以使用中文,又可以使用英文。所以在头部注释的位置一定要加上 # coding:utf-8

THE END
0.零基础学阿拉伯语软件排行榜有哪些哪个好用十大相关软件专辑 零基础学阿拉伯语软件有哪些?几款零基础自学阿拉伯语app推荐初学英语零基础入门软件成人零基础学英语的app英语基础教学从零开始软件学英语零基础app免费学英语零基础自学app学韩语零基础入门app免费学日语零基础app学韩语零基础app成人初学英语零基础入门app免费学法语零基础app免费学西班牙语零基础app零jvzquC41o0vjcw|cp0ipo8x1|l338:99:5
1.莱特韩语背单词最新版下载莱特韩语背单词,让你零基础轻松学韩语,无字幕追韩剧韩综再也不是问题,让你放心追剧追韩综追韩国欧巴idol;为韩语学习爱好者量身打造的学习软件;韩语发音、单词、语法、对话……步步进阶,轻松入门学韩语。 莱特韩语背单词手机版特色 【完备韩语词库】全套延世韩国语、topik考试初级、中级、高级、以及各种分类词库,应有尽jvzq<84yyy4:8?80eqs0fx|pkplp1:59;:4ivvq
2.莱特阿拉伯语学习软件阿拉伯语方言多且差异大。让莱特帮助你保持学习的动力 每天五分钟 快速入门 我们为初学者提供了精心定制的章节,让零基础用户可以从字母开始,由浅入深,从字母拼读到单词拼读,从发音到朗读,快速入门语言。 独创科学记忆法高效背词 我们在基于艾宾浩斯遗忘曲线的基础上,通过记录学习者的单词学习过程,由AI进行熟悉程度判断jvzq<84yyy4kkjrkpi}fpqzc0eun1ufpiwghg8ft