【環球網科技綜合報道】據外媒消息,在人工智能領域持續創新的OpenAI公司,近日宣佈了一項革命性的聲音克隆技術——“語音引擎”。該技術作爲其現有文本轉語音API的擴展,僅需15秒的音頻樣本,便能模仿任何說話者的聲音。
OpenAI表示,這項新技術能夠生成“自然的語音”和“情感豐富且真實的聲音”。自2022年以來,該技術一直在研發中,並已應用於支持公司當前的文本轉語音API和Read Aloud功能中的預設語音。

爲了展示這項技術的實力,OpenAI在其官方博客上發佈了一系列聲音樣本,這些樣本的逼真程度令人驚歎。公司鼓勵公衆傾聽這些聲音,並想象它們在未來可能帶來的各種應用場景。
OpenAI認爲,這項技術對於閱讀輔助、語言翻譯以及幫助言語障礙患者具有重大意義。例如,在布朗大學的一個試點項目中,該技術已被用於創建從學校項目錄制的音頻中提取的語音克隆,以幫助那些患有言語障礙的學生。
然而,OpenAI承認它存在被濫用的風險,特別是在選舉年等敏感時期。因此,在全面推出之前,公司必須解決相關的隱私問題和道德挑戰。
爲此,OpenAI已經與來自政府、媒體、娛樂、教育等多個領域的合作伙伴進行了深入交流,以確保在產品發佈時能夠將風險降至最低。同時,所有預覽測試人員都必須遵守OpenAI的使用政策,該政策明確禁止在未經同意或缺乏合法權利的情況下冒充他人。
此外,OpenAI還實施了一系列安全措施,包括使用水印技術追蹤音頻來源,以及對系統的使用方式進行主動監控。當產品正式推出時,公司將設立一個“禁止語音列表”,以檢測並阻止與名人過於相似的人工智能生成聲音。
在宣佈這項新技術的同時,OpenAI還透露了與微軟的另一項重大合作計劃,雙方將共同打造一款名爲“Stargate”的基於人工智能的超級計算機。據報道,該項目預計將耗資高達1000億美元。