環球視角：OpenAI推出聲音克隆新技術 15秒音頻即可模仿任何說話者-科技-極速新聞-每日看看

2024-03-30 08:58 由環球網發佈於科技 543

【環球網科技綜合報道】據外媒消息，在人工智能領域持續創新的OpenAI公司，近日宣佈了一項革命性的聲音克隆技術——“語音引擎”。該技術作爲其現有文本轉語音API的擴展，僅需15秒的音頻樣本，便能模仿任何說話者的聲音。

OpenAI表示，這項新技術能夠生成“自然的語音”和“情感豐富且真實的聲音”。自2022年以來，該技術一直在研發中，並已應用於支持公司當前的文本轉語音API和Read Aloud功能中的預設語音。

爲了展示這項技術的實力，OpenAI在其官方博客上發佈了一系列聲音樣本，這些樣本的逼真程度令人驚歎。公司鼓勵公衆傾聽這些聲音，並想象它們在未來可能帶來的各種應用場景。

OpenAI認爲，這項技術對於閱讀輔助、語言翻譯以及幫助言語障礙患者具有重大意義。例如，在布朗大學的一個試點項目中，該技術已被用於創建從學校項目錄制的音頻中提取的語音克隆，以幫助那些患有言語障礙的學生。

然而，OpenAI承認它存在被濫用的風險，特別是在選舉年等敏感時期。因此，在全面推出之前，公司必須解決相關的隱私問題和道德挑戰。

爲此，OpenAI已經與來自政府、媒體、娛樂、教育等多個領域的合作伙伴進行了深入交流，以確保在產品發佈時能夠將風險降至最低。同時，所有預覽測試人員都必須遵守OpenAI的使用政策，該政策明確禁止在未經同意或缺乏合法權利的情況下冒充他人。

此外，OpenAI還實施了一系列安全措施，包括使用水印技術追蹤音頻來源，以及對系統的使用方式進行主動監控。當產品正式推出時，公司將設立一個“禁止語音列表”，以檢測並阻止與名人過於相似的人工智能生成聲音。

在宣佈這項新技術的同時，OpenAI還透露了與微軟的另一項重大合作計劃，雙方將共同打造一款名爲“Stargate”的基於人工智能的超級計算機。據報道，該項目預計將耗資高達1000億美元。

實用工具推薦