環球視角:OpenAI推出新一代AI模型GPT-4o

【環球網科技綜合報道】北京時間5月14日凌晨,全球領先的AI研究公司OpenAI通過一則簡短的視頻介紹,正式發佈了其最新一代的AI模型GPT-4o。這一模型實現了音頻、視覺和文本推理的實時交互,標誌着人工智能技術的又一重要進步。

GPT-4o的名稱中“o”代表Omni,即全能的意思,凸顯了其多功能的特性。相較於去年11月推出的GPT-4-turbo,GPT-4o在性能上有了顯著的提升。據OpenAI介紹,GPT-4o在處理速度上提升了高達200%,同時在價格上也實現了50%的下降,使得更多用戶可以享受到先進AI技術帶來的便利。

值得一提的是,GPT-4o還將在未來幾周內推出語音和視頻輸入功能,這將進一步提升用戶與AI模型的交互體驗。此外,OpenAI還宣佈,GPT-4o與ChatGPT Plus會員版的所有功能,包括視覺、聯網、記憶、執行代碼以及GPT Store等,將對所有用戶免費開放,這無疑將大大降低用戶使用先進AI技術的門檻。

在發佈會上,OpenAI的聯合創始人兼總裁格雷格·布羅克曼展示了GPT-4o的強大功能。他通過一段5分鐘的對話,展示了新版ChatGPT如何通過視覺AI能力理解攝像頭中的內容,並通過語音與舊版ChatGPT進行交互。這種交互方式不僅豐富有趣,還支持中途打斷和對話插入,同時具備了上下文記憶能力。

OpenAI的CEO薩姆·奧爾特曼對GPT-4o給予了高度評價,稱其爲OpenAI有史以來最好的模型。他表示:“新的GPT-4o模型很智能,速度很快,是原生多模態,並且可供所有ChatGPT用戶使用,無論是免費版本還是付費GPT-4版。”他還強調了OpenAI的使命,即將優秀的AI工具交到每個人手中。

然而,對於GPT-4o的發佈,業內專家也提出了一些質疑。有專家指出,儘管GPT-4o在多模態能力上有所提升,但OpenAI並未展示出真正的視覺多模態突破功能。此外,在實時音頻交互方面,市場上已有其他產品具備了類似的功能。



Scroll to Top