數位公司標誌

(SeaPRwire) –   OpenAI於週四向付費用戶發布了其最先進的AI模型o1。此次發布拉開了公司「」活動的序幕——連續十二個版本發布以慶祝節日。

OpenAI大力宣傳o1的「複雜推理」能力,並於週四宣布該模型的無限訪問權限每月費用為200美元。在公司發布的展示該模型優勢的影片中,一位用戶上傳了一張木製鳥屋的照片,並詢問模型關於如何建造類似鳥屋的建議。該模型「思考」了很短時間,然後輸出了一套表面上看起來很全面的說明。

仔細檢查後發現,這些說明幾乎毫無用處。AI以英寸為單位計算任務所需的油漆、膠水和密封劑的數量。它只給出了鳥屋前面板的尺寸,而沒有其他尺寸。它建議剪裁一塊砂紙到另一組尺寸,但沒有明顯的理由。而在說明列表的另一部分,它說「確切尺寸如下…」然後卻沒有給出任何確切尺寸。

英國一家行業機構——木匠協會(Institute of Carpenters)的主任James Filus在一封郵件中表示:「你從圖片中獲得的關於建造鳥屋的知識與從文字中獲得的知識一樣多,這在某種程度上否定了AI工具的全部目的。」他指出,材料清單包括釘子,但所需工具清單中沒有錘子,而且建造這個簡單的鳥屋的成本「遠不及」o1估計的20-50美元。「簡單地說『安裝一個小鉸鏈』並沒有真正涵蓋設計中最複雜的部分,」他補充說,指的是影片中聲稱解釋如何為鳥屋添加活動屋頂的另一部分。

OpenAI沒有立即回應置評請求。

這只是AI產品演示與其預期目的背道而馳的最新例子。去年,Google為一款AI輔助搜索工具發布的演示錯誤地表示詹姆斯·韋伯太空望遠鏡做出了它沒有做出的發現,這一失誤導致該公司的股價暴跌。最近,一個類似的Google工具的更新版本產生了具有冒犯性的回答,並且表示他們可以用膠水將奶酪粘在披薩上。

根據公開基準測試,OpenAI的o1是迄今為止其功能最強大的模型,它採用了與ChatGPT不同的方法來回答問題。它本質上仍然是一個非常先進的下一個詞預測器,使用機器學習方法,從互聯網及其他來源的數十億字的文本數據中進行訓練。但它不是立即根據提示輸出單詞,而是使用一種稱為「思維鏈」推理的技術,在幕後「思考」答案一段時間,然後才給出答案。這種技術通常比讓模型本能地輸出答案產生更準確的答案,而OpenAI則大力宣傳o1的推理能力——尤其是在數學和編碼方面。根據OpenAI在9月份發布的模型預覽版本以及相關數據,它可以準確回答78%的博士級別科學問題。

但顯然一些基本的邏輯錯誤仍然可能出現。

本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。

分類: 頭條新聞,日常新聞

SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。