IT之家 1 月 15 日消息,科技媒體 TechCrunch 昨日(1 月 14 日)發(fā)布博文,報道稱 OpenAI 最新推理模型 o1 在推理過程中,會使用中文、波斯語等多種語言“思考”,引發(fā)了 AI 界的關(guān)注和猜測。
網(wǎng)友 @RishabJainK 于 1 月 9 日在 X 平臺發(fā)布推文,表示即便提示詞中僅輸入英文,在推理過程中,也會使用中文等其他語言,截圖顯示“提議新創(chuàng)意”。OpenAI 尚未解釋或回應(yīng) o1 的這種行為。
專家推測IT之家附上一些專家的推測如下:Hugging Face CEO Clément Delangue 等專家指出,o1 等推理模型的訓(xùn)練數(shù)據(jù)集中包含大量中文,可能導(dǎo)致 o1 使用中文進行推理。
Google DeepMind 的研究員 Ted Xiao 認(rèn)為,OpenAI 等公司使用第三方中文數(shù)據(jù)標(biāo)注服務(wù),o1 切換到中文是“中文語言對推理的影響”的一個例子,數(shù)據(jù)標(biāo)注(標(biāo)簽)幫助模型理解數(shù)據(jù)。
一些專家認(rèn)為,o1 可能只是在使用其認(rèn)為最有效的語言來解決“幻覺”等問題。阿爾伯塔大學(xué)的 AI 研究員 Matthew Guzdial 表示,模型并不知道什么是語言,或者語言之間的差異,所有文本對它來說都是一樣的,模型使用 token(詞、音節(jié)或單個字符)進行處理,而不是直接處理單詞。