AI能秒產上千種旋律,只缺人類一個好故事

近日,一則消息引爆音樂圈。人工智能歌手薩尼婭·莫奈成爲首位憑藉電臺播放量登上美國公告牌成人R&B電臺播放榜的AI藝人,隨着單曲《How was I supposed to know》的走紅甚至簽下了價值約300萬美元的唱片合約。與此同時,AI藝人上榜速度還在迅速加快,連續四周均有AI藝人亮相“新興藝人榜”。

整個音樂產業的反應撕裂成兩極,而更值得關注的,或許是這一現象背後所揭示的創作轉向:AI歌手的興起並非意在取代人類,而是行走在拓展音樂語言邊界的軌道上,成爲一種與人類情感和想象力並行不悖,甚至可相互激發的新藝術表達形式,它迫使我們重新思考創作的本質和藝術的定義。

從“工具”到“語言”:AI歌手的演進

與初音未來、洛天依這類“聲庫工具”有所區別,薩尼婭·莫奈所代表的是由“生成式人工智能”推動的創作主體。她的創造者特麗莎·妮基·瓊斯在美國哥倫比亞廣播早間新聞節目裏坦言了她利用AI創作的原始動機:圓一個未曾實現的音樂夢。

特麗莎從小在唱詩班的氛圍中長大,內心蘊藏着對音樂的深切熱愛,然而,由於自己的嗓音條件並不出衆,她始終未曾踏上職業音樂人的道路。這份深藏心底的遺憾,成爲了她日後創作的情感基石。直到她接觸到人工智能音樂創作平臺Suno,才發現自己可以用另外一種形式唱出心中的旋律。於是她潛心研究如何能與AI進行對話。

特麗莎的創作始於她的詩庫,這些詩歌是她個人情感和經歷的結晶,構成了歌曲的歌詞部分,這也是整個創作過程中最具有“人性”和原創性的元素。隨後,她會將這些歌詞輸入到Suno平臺中,並輔以一系列詳細的文本提示詞。這些提示詞涵蓋了音樂的各個方面,比如:慢節奏的R&B風格、女性靈魂唱腔、輕柔的吉他、沉重的鼓點等。這個輸入的階段,也是連接人類創意和AI執行的關鍵橋樑。AI會根據歌詞的情感基調和節奏,在幾秒內創作出與之匹配的旋律線條。同時,它會根據提示詞中指定的樂器,進行自動化的編曲和混音。人聲部分,AI會生成一個符合指令描述的聲音,並根據旋律和歌詞演唱,甚至能處理複雜的轉音、顫音技巧,流暢且富有靈魂的、類似人類歌手演唱時的微情感變化。這個“處理”階段,是AI將抽象的文字指令轉化成具體音樂實體的核心環節。AI生成音樂的最後一步是“輸出”與“篩選”。Suno通常會生成兩個版本的歌曲供特麗莎選擇,聽完後如果不符合她的創作意圖,特麗莎就會繼續調整提示詞,或者保持原有設置,再次生成新的版本。這個過程可能需要重複成百上千次,直至她尋到心中那個最完美的版本爲止。

談到上榜歌曲的創作背景,特麗莎透露,這首歌的靈感來源於她八歲時失去父親的創傷經歷。這種源於生命早期的深刻情感,爲歌曲注入了無法僞造的真實性,使得許多有過相似經歷的聽衆能夠產生強烈的共鳴。當聽衆瞭解到歌詞背後的真實故事後,AI賦予的外殼便顯得不那麼重要,因爲傳遞情感的核心,歌詞以及背後的故事是百分之百真實的。正如特麗莎所言:“薩尼婭·莫奈是我的延伸,她的形象就是我本人。”

創作的新勞動:從“指令”到“對話”

在AI參與創作的過程中,人類創作者的核心能力正在發生轉變。他們不再僅僅依賴音樂理論和技藝的打磨,而是需要發展出一種新的表達能力:如何用精準、生動、富有啓發性的語言,將內心的真實情感經歷和音樂想象力轉化爲AI能夠理解並執行的“創意指令”。

在創作中爲獲得“恰到好處的哽咽感”,特麗莎曾嘗試了32種提示詞變體——有的讓AI理解成了隨機噪音,有時提示詞則導致了機器停頓,最終使用“Stochastic”這一數學中描述不確定性的標準術語,而精準觸發了Suno模型中“隨機性中斷的不完美髮聲”節點,生成出了目標效果。

有時AI能執行卻“誤解”的指令,反倒成爲了創作者靈感的富礦。特麗莎在生成《How was I supposed to know》時,最初提示詞指向“溫暖的靈魂樂”,但是AI某次輸出時卻混入了冷感的電子故障音。這個意外使得歌曲獲得了聽感上的“情感溫差”,“誤打誤撞”產生的失真噪聲反而強化了歌詞中“無法預知命運”的無力感。

人與AI之間啓發,也被啓發;引導,也被引導,使得創作不僅是產出音樂,更像是一場AI倒逼的自我解剖。這個過程,本質上是一場人機之間的對話。使用者輸入相似的指令,可能會得到風格迥異、質量不一的多個版本。創作過程不再是從零到一的線性推進,而更像是一種不斷地開盲盒的體驗,不斷從開出的盲盒中篩選、尋找出符合自己願景的聲音。每個盲盒都是算法對人性的一次統計學翻譯,而創作者的任務是在數百個“翻譯版本”中,聽見那個能反向照亮自己情感盲區的回聲。

AI是一面鏡子,也是一扇窗

AI歌手能夠穩定地產出批量的、兼具熟悉感與新意的作品,這正是其能快速在流行榜單中佔據一席之地的原因。在流媒體主導的音樂消費時代,聽衆越來越傾向於“場景化”的聆聽,音樂不再只是需要凝神欣賞的完整藝術品,更是陪伴、氛圍與情緒的載體。

AI像一面鏡子,映照出當下音樂工業的某些困境:套路化生產、創意重複、情感稀薄。當AI能在五分鐘內就批量炮製出當代最流行模板的歌曲,是不是也說明人類的創作早已化爲了“人肉算法”?據公告牌的研究所揭示,過去十三年間,80%的冠軍單曲都建立在相同的四種和絃框架上。AI能用幾十秒寫出一首歌,因爲它可以直接調取硬盤裏的模板數據;而人類可能得花上數倍的時間,因爲人類靠的是經驗和記憶去調取創作模板,這就是“人肉算法”。人類和AI乾的是同一件事,只不過人類讀取的是“生物硬盤”,讀取速度要慢得多。

AI也是一扇窗,爲我們打開了新的可能。特麗莎創造出的AI藝人已與唱片公司簽署價值高達300萬美元合約。這種現象不僅是資本市場對AI歌手商業潛力的敏銳捕捉,在更深層次上也是對這種以AI爲筆、書寫個人故事的獨特性的一種肯定。在套路可以被無限複製的時代,純粹的個人故事反而成爲了最稀缺的資產。傳統音樂工業要創作出一首優質歌曲,需要寫詞、作曲、編曲、演唱、表演各個環節人才的分工配合,或者創作者樣樣都得精通。而AI的出現,重新定義了音樂的創作,它將技術性勞動和創意決策分開。AI背後的創作者更像是一位創意導演,一位與AI協作的“畫師”,用語言和想象力勾勒出音樂的輪廓與色彩。你可以是一名心理療愈師,將患者的故事寫成歌詞來生成療愈音樂;也可以是一名公司上班的白領,在午休時用手機錄下隨意哼唱的旋律,讓AI來延展你的情緒;同樣你也可以是一名退休老教師,用AI譜出屬於自己的流金歲月。AI的發展並非要取代人類的創造力,而是將其從某些重複性、技術性的勞動中解放出來,促使創作者去探索那些真正屬於人類的情感深度與藝術獨特性。

AI的獨特價值,在於在“不懂”中拓展表達的邊界,它可能不理解人類世界中的悲與喜、愛與恨,但卻能將這些情感符號轉化爲非人的聲學結構,而這種結構卻反向地讓人意識到在AI的這些“錯誤”裏,是不是能照見更深層的自我,發現自我從未想過的表達路徑?

薩尼婭·莫奈的登榜,絕非一個終點,而是一個起點。AI歌手作爲一種已然存在且不可逆的新興藝術形式,是我們必須直面的現實。未來,AI歌手與人類歌手、創作者之間並非一場你死我活的取代,而更可能走向一種深度與功能化分化的共生。AI將不斷拓展音樂藝術的技術邊界,滿足娛樂工業對效率、規模與先鋒體驗的追求,而人類歌手將會更加向內迴歸,專注於那些唯有人類才能感知並且賦予意義的思考與情感。而對於音樂創作者而言,在這場人機共奏的新樂章中,會有更多來自各行各業的新人羣匯入。真正的挑戰不僅是如何與AI對話,更是在這一過程中,保留住我們自己的語言與情感溫度。

(作者爲上海戲劇學院表演系講師)



Scroll to Top