科普中国语言代码

语言代码(或语言编码)是一组用来代表语言的代码。语言代码是由字母或数字组成的短字符串,用于分类图书馆典藏、计算机程序上的本地化和翻译等用途。

ISO 639

ISO 639-1

ISO 639-2

ISO 639-3

SIL代号

万维网联盟的IETF语言标签1

ISO 639是国际标准化组织为各语言所订定的语言代码。ISO 639的标题是Codes for the representation of names of languages(表示语言名称的代码),分为六个部分。2

ISO 639-1是国际标准化组织ISO 639语言代码标准的第一部分。它含有 184 个两字母的编码,用来标示世界上主要的语言。这些代码在很多地方都被用作语言的简写,例如:

英语(English)用en表示。

德语(Deutsch)用de表示(Deutsch是德语的本名)。

日语(Japanese)用ja表示(尽管日语的拼音是Nihongo)。

汉语使用zh表示,来自“中文”的汉语拼音:Zhōngwén。

ISO 639-2:1998 是国际标准化组织ISO 639语言编码标准的第二部分,为各语言和语系所订定的 3 字母语言代码。 ISO639-2 的注册机构是美国国会图书馆。

有 22 种语言同时在 ISO 639-2 中有两个 3 字母语言代码:

ISO 639-2/B ,书籍目录使用 (bibliographic use)。

ISO 639-2/T ,技术专门使用 (terminological use)。

这 22 种语言本身都已有ISO 639-1编码。

ISO 639-2/B 是原本供书籍使用的代码,采用英语的语言名称排列,而并非使用该语言的语言名称排列。例如德语的 ISO 639-2/B 码是ger, ISO 639-2/T 码是deu;中文(汉语)的 ISO639-2/B 码是chi, ISO639-2/T 码是zho。除英语图书馆编排外,应使用 ISO639-2/T 码。

THE END
0.从3800年前的西奈字母,到满文藏文,字母文字是怎么普及的?公元4世纪,纳巴泰字母的一种手写体发展成阿拉伯字母。阿拉伯字母共有27个表示辅音的字母,和一个表长开口元音的字母ʾalif;并在字母上添加音符来标注短元音与其他发音细节。目前阿拉伯语字母是世界上第二多人使用的拼音文字,仅次于拉丁字母。 6 公元前6世纪,亚兰语在印度演化为婆罗米文。 现存最早的实例是斯里兰卡的阿努拉德普勒出土jvzq<84yyy4489iqe0ipo8hqpvkov8751372886815>97988;a722=7693920|mvon
1.汉语拼音方案大全11篇呼读音与字母表的读音多数不相同,呼读音并不是辅音和元音的结合,只用来呼读、称说,便于辅音音素教学,在声母和韵母拼合成一个音节时,必须丢掉辅音后面所加的元音。本音就是拉丁字母本来的读音,由于英语在全世界的强势地位,在国内《方案》拼音字母的本音可以看作是英语字母的本音。很多学生读汉语拼音就读作英文字母的jvzquC41|iqt0ofdkcu/exr0ep5icx|gp1832B:0jvsm
2.SparkNLP第2章:自然语言基础sparknlp本文围绕自然语言处理展开,介绍了自然语言的起源、口语与书面语差异,阐述了语言学各子领域,如语音学、形态学、句法和语义学等知识。还介绍了多种书写系统,包括字母表、Abjads、Abugidas等,以及编码方式如ASCII、Unicode、UTF - 8,最后讲解了标记化技术及不同语言标记的挑战。 jvzquC41dnuh0lxfp0tfv8xkmje17;>1ctzjeuj1fgzbkux134=68:64;
3.非拉丁文字语音合成:espeakespeak-ng作为一款强大的开源文本到语音合成器,目前支持127种语言及口音。从技术架构上,其通过语言规则文件与音素映射表实现多文字系统兼容,尤其对非拉丁文字采用特殊处理流程。 官方语言列表显示,阿拉伯语(ar)属于闪米特语系(Semitic),而俄语(ru)等西里尔字母语言归类为东斯拉夫语族(East Slavic)。这些语言在docs/langujvzquC41dnuh0lxfp0tfv8lkvdrpih527270c{ykenk0fnyckny03>97;3759