pen的o模型推理时蹦出中文专家猜:可能只想用最高效的语言来思考

媒体报道,在OpenAI 发布其首个“推理”AI模型o1不久后,有用户注意到一种奇怪的现象:即使用户是用英语提问,这一模型有时会在回答问题时突然“转而用”中文、波斯语或其他语言“思考”。

例如,当被问及“单词‘strawberry’中有多少个‘R’?”时,o1会开始其“推理”过程,通过一系列推理步骤得出答案。如果问题是用英语写的o1的最终回答会是英语,但在得出结论之前,它可能会在某些步骤中使用其他语言。

一位Reddit用户表示,“o1在中途随机地开始用中文思考。” 另一位用户在X发文询问:“为什么o1会随机开始用中文思考?整段对话(超过5条信息)都没有使用中文。”

OpenAI尚未对o1的这种奇怪行为作出解释,也没有正式承认这一现象。AI专家对此也没有明确答案,但他们提出了一些猜测。

使用中文数据标注引起?

包括 Hugging Face 的首席执行官 Clément Delangue等人表示,像o1这样的推理模型接受了大量包含中文字符的数据训练。谷歌DeepMind的研究员Ted Xiao声称,包括OpenAI在内的一些公司使用中国的第三方数据标注服务,而o1转向中文可能是“推理过程中受到中文语言影响”的一个例子。

Ted Xiao在X上写道:

“OpenAI和Anthropic等实验室利用[第三方]数据标注服务,为科学、数学和编程领域的高水平推理数据提供支持,而许多数据提供商都位于中国。”

“OpenAI和Anthropic等实验室利用[第三方]数据标注服务,为科学、数学和编程领域的高水平推理数据提供支持,而许多数据提供商都位于中国。”

在AI训练领域,标注(Labels,也称为标签或注解)在训练过程中帮助模型理解和解释数据。例如,用于训练图像识别模型的标注可能包括为对象周围添加标记,或为图像中的每个人、地点或物体提供描述。

研究表明,带有偏见的标注可能会导致带有偏见的模型。例如,普通标注员更可能将非标准英语(如美国黑人英语,AAVE)标记为“不健康”(toxic)语言,这导致基于这些标注训练的AI毒性检测器更倾向于认为AAVE 是“不健康”的。

不过,也有一些专家并不认同“中文数据标注”的猜测。他们指出,o1同样可能在解决问题时切换到印地语、泰语或其他语言。

AI只想使用最高效的语言来思考?

另一种观点认为,o1和其他推理模型可能只是使用了它们认为最能有效实现其目标的语言(或出现了幻觉)。

阿尔伯塔大学的助理教授、AI 研究员Matthew Guzdial在接受TechCrunch采访时说,“模型并不知道语言是什么,也不知道语言之间有区别。对它来说,这些只是文本而已。”

实际上,模型并不直接处理单词,而是处理“标记”(tokens)。标记可以是单词(例如“fantastic”),也可以是音节(例如“fan”、“tas”和“tic”),甚至是单词中的单个字符(例如“f”、“a”、“n”、“t”、“a”、“s”、“t”、“i”、“c”)。

像标注一样,标记也可能引入偏见。例如,许多从单词到标记的转换器假设句子中的空格表示一个新单词的开始,而实际上并非所有语言都使用空格来分隔单词。

Hugging Face的软件工程师Tiezhen Wang赞同这一观点,认为推理模型的语言不一致性可能源于模型在训练期间与特定语言建立的某些关联。

“通过接纳每一种语言的细微差别,我们扩展了模型的世界观,使模型能够全面学习人类知识。例如,我喜欢用中文做数学,因为每个数字只有一个音节,这让计算更简洁高效。但在讨论诸如‘无意识偏见’之类的话题时,我会自动切换到英语,因为我最初就是通过英语学习和吸收这些概念的。”

“通过接纳每一种语言的细微差别,我们扩展了模型的世界观,使模型能够全面学习人类知识。例如,我喜欢用中文做数学,因为每个数字只有一个音节,这让计算更简洁高效。但在讨论诸如‘无意识偏见’之类的话题时,我会自动切换到英语,因为我最初就是通过英语学习和吸收这些概念的。”

AI模型是概率机器,通过大量示例的训练学习模式,并据此作出预测。然而,非盈利组织艾伦人工智能研究所的研究科学家Luca Soldaini警告说,“我们无法确定模型内部的运行逻辑。对已经部署的AI系统进行这类观察,由于其高度不透明性,是无法支持任何结论的。这也说明了为什么在构建AI系统时保持透明性至关重要。”

THE END
0.哈梅内伊为何用中文发文谈中伊关系传递深层战略意图哈梅内伊为何用中文发文谈中伊关系 传递深层战略意图。8月31日,伊朗最高领袖哈梅内伊在社交媒体上首次同时使用波斯语和中文,针对中伊关系发表了一篇深入的论述,此举引起了国际舆论的广泛关注。他指出,伊朗与中国分别位于亚洲的东西两端,是历史悠久的文明古国,不仅拥有深厚的历史积淀,还具备重塑地区乃至全球格局的力量。 jvzquC415i4djrsc0eun1jhv1oomk}ft{174299399532;:2;2706A<:26:70qyon
1.‎广州地铁通广州地铁公交出行导航线路appBrowse 广州地铁通-广州地铁公交出行导航线路app and other apps and games on the App Store.jvzquC41crvt0jurng4dqv4dy1gqr8*G7'H:'KK'G7+C9.>G'G;&;L*D2'K:'B8':3+F;.=2';G.'N:'D;+CH.J7'D=&;N*G7'?D'K5'G;+:5.=3'G;&:>*CE'K5'KF'C6+F7.=9'DG&GA*C3'>D'N:'CH+CE.J:':>&CJ*G9'HB'KK'G:+C9.FHcrv0km678:?37?;2Aukf/jqn?fkwgutrgt3pvqjt/cvqu
2.→warān,翻译成中文,例句,中古波斯语将“warān"翻译成中文 公羊是将“warān"翻译成 中文。 warān + 加 中古波斯语-中文字典 公羊 Dbnary: Wiktionary as Linguistic Linked Open Data 显示算法生成的翻译 加 在上下文、翻译记忆库中将“warān"翻译成 中文 错误 再试一次Glosbe 在波兰以♥制成 Tools 字典生成器 发音记录仪 批量jvzq<84|j0mmq|gg0eun1yfn1|n0yjw'E6+93w
3.哈梅内伊为何罕见用中文发帖谈中伊关系重塑力量当地时间8月31日,伊朗最高领袖哈梅内伊在社交媒体上用波斯语和中文就中伊关系发表文章。他指出,伊朗和中国作为亚洲东西两翼的文明古国,不仅拥有深厚的历史底蕴,还具备重塑地区乃至全球格局的力量。他认为,全面落实两国战略合作协议的各项内容将为这一进程奠定坚实基础。(责任编辑:卢其龙 CM0882)jvzquC415i4djrsc0eun1jhv1oomk}ft{174299399532;:2;2706A<9:;860qyon
4.中文简体中文简体 - 波斯语 翻译, 字典, 声音, 检测语言, 回译, 解码器, 键盘, 拼写, 比较译文, 翻译和聆听, 下载扩展jvzquC41htkf/}wcpurbvrtp0ksutjsunczpt7sgv1Iikwjug/Yjoyqkhkke/ufpiwghghHjkpktg6Xkorrjhrjf/Rksurfpavxbp|qcvkuo1
5.波斯语翻译===支持中文与波斯语的地道发音=== 中文与波斯语文本语音合成,地道方言发音,让用户快速本地化,支持离线发音。 ===支持中文与波斯语的语音对讲翻译=== 出行旅游的用户特别喜爱,能准确并快速的把语音转化为文本内容,并快速翻译成中文或波斯文。 ===支持中文与波斯文图片拍照翻译=== 搭载超jvzquC41crvt0jurng4dqv4pg1gqr8*G8'H4'J7'G8+:8.FH'G>&CO*CF'K8'KK'DD+F:.FH';7.'N>';D+C8.J7';L&DJ*G9'G2'A5'G7+BF.F8'G:&DB*C2'K7'K8'C4+F8.>8'CL&GA*CH'GE'N<'DH+CD.J:'CL&;:*G9'G6'BJ'G7+:;.F:1kj79>74757:4
6.波斯文版《孟子》出版发行首次从中文翻译成波斯语近日,由伊朗凤凰出版社、五洲传播出版传媒有限公司出版的波斯文版《孟子》正式出版发行,这是首次直接从中文翻译成波斯语的儒家经典《孟子》。 据西南大学伊朗研究中心外籍专家、西南大学历史文化学院讲师艾森介绍,目前波斯语的中国儒家经典图书,绝大部分是从英语版、法语版等其他语种儒家经典翻译成波斯语,这次出版的波斯文jvzq<84yyy4djrscmqth|r3qti5knqoa64>31;543360v;5433638h:447>10qyo
7.波斯文版《孝经》出版发行——首次从中文翻译成波斯语近日,由伊朗塔拉叶出版社出版的波斯文版《孝经》正式出版发行,这是首次直接从中文翻译成波斯语的儒家经典《孝经》。据西南大学历史文化学院伊朗研究中心研究员艾森介绍,目前波斯语的中国儒家经典图书,绝大部分是从英语版、法语版等其他语种儒家经典翻译成波斯语,这次出jvzquC41jky/u€z0gf{/ew4kphu03:=814>977mvo
8.Oblivion国际化实践:支持中文俄语波斯语等多语言还在为Android应用的语言障碍烦恼吗?Oblivion通过完善的国际化方案,让全球用户都能获得一致的使用体验。本文将带你了解Oblivion如何实现多语言支持,覆盖中文、俄语、波斯语等5种语言。 【免费下载链接】oblivionUnofficial warp client for android 项目地址: https://gitcode.com/GitHub_Trending/ob/oblivion jvzquC41dnuh0lxfp0tfv8lkvdrpih52;4?0c{ykenk0fnyckny03>9894?44
9.波斯语课中国预告片1:定档版(中文字幕)波斯语课中国预告片1:定档版 (中文字幕) Loaded: 0% Progress: 0% / 2021-03-09>我要报错 2021-03-09 18:24:04now you see me 冲 来自豆瓣App 2021-03-09 18:33:55momo 冲! 来自豆瓣App 2021-03-09 18:46:31球形荒野 俩月前就看完啦`` jvzquC41oq|jg7iqwdgo0lto1vxbkujt14=3;9>1
10.人民日报发文赞扬《论语》汉语波斯语对照版发行为推动“一带一路”国家文化交流,尼山世界儒学中心、中国孔子基金会策划开展“一带一路”国家《论语》译介工程,出版阿拉伯语、蒙古语、西班牙语、捷克语、葡萄牙语等5种中外文对照本《论语》。2022年,中文波斯文对照版《论语》正式立项,译者为第十六届中华图书特殊贡献奖获得者、西南大学伊朗研究中心研究员艾森·杜斯jvzquC41{nk|3uyw4ff~3ep1oohx4323603@540jzn