多個(gè)網(wǎng)絡(luò)小說(shuō)平臺(tái)開(kāi)發(fā)了AI寫(xiě)作智能體,網(wǎng)絡(luò)文學(xué)是最早擁抱AIGC的文學(xué)門(mén)類之一。(李慕琰使用AI工具生成/圖)
“在夜幕的掩護(hù)下,一個(gè)全身黑衣的年輕男子以堅(jiān)定的步伐,在迷霧蕪谷中穿行。他的每一步都精確得體,如同一位優(yōu)雅的舞者,在危險(xiǎn)的世界中找尋自己的節(jié)奏。”
這是網(wǎng)絡(luò)小說(shuō)《天命使徒》的開(kāi)篇。這部篇幅超過(guò)100萬(wàn)字、主要人物就有8位的長(zhǎng)篇小說(shuō),文本幾乎全部由國(guó)內(nèi)人工智能大語(yǔ)言模型(下稱“大模型”)生成。
《天命使徒》由華東師范大學(xué)傳播學(xué)院院長(zhǎng)王峰和他的團(tuán)隊(duì)制作,于2024年4月發(fā)布。這部小說(shuō)發(fā)布后的半年里,這個(gè)團(tuán)隊(duì)又開(kāi)發(fā)了長(zhǎng)篇小說(shuō)創(chuàng)作平臺(tái)“靈咔靈咔”,通過(guò)這個(gè)平臺(tái),點(diǎn)擊數(shù)個(gè)關(guān)鍵詞,便可生成一部長(zhǎng)篇小說(shuō)。
南方周末記者在“靈咔靈咔”網(wǎng)站上隨機(jī)點(diǎn)取“無(wú)敵流”“學(xué)神”“瘋批”“百合”“架空”“都市”等關(guān)鍵詞,沒(méi)有修改小說(shuō)簡(jiǎn)介、劇情動(dòng)力、人物角色等任何設(shè)定,“創(chuàng)作”了一篇名為《都域紀(jì)元之正義光》的網(wǎng)文,長(zhǎng)達(dá)100章,每一章近3000字,整體過(guò)程耗時(shí)不超過(guò)2分鐘。
這部網(wǎng)文語(yǔ)言稍顯粗糙,也出現(xiàn)了部分內(nèi)容冗余、習(xí)慣在每章末尾進(jìn)行總結(jié)等AI創(chuàng)作的常見(jiàn)問(wèn)題,但是通篇人物稱謂基本穩(wěn)定、邏輯鏈條成立,穿插著人物之間的對(duì)白、心理和動(dòng)作細(xì)節(jié)描寫(xiě),乍一看并沒(méi)有AI網(wǎng)文曾被飽受質(zhì)疑的“機(jī)器人味”。
中國(guó)社會(huì)科學(xué)院文學(xué)研究所發(fā)布的《2023年中國(guó)網(wǎng)絡(luò)文學(xué)發(fā)展研究報(bào)告》顯示,2023年,網(wǎng)絡(luò)文學(xué)作者規(guī)模達(dá)2405萬(wàn),作品數(shù)量達(dá)3620萬(wàn)部,用戶數(shù)量達(dá)5.37億,用戶同比增長(zhǎng)9%。就規(guī)模而言,中國(guó)網(wǎng)絡(luò)文學(xué)產(chǎn)業(yè)正在突飛猛進(jìn)地發(fā)展。
網(wǎng)絡(luò)文學(xué)也是最早擁抱AIGC(生成式人工智能)的文學(xué)門(mén)類之一。近年來(lái),多個(gè)網(wǎng)絡(luò)小說(shuō)平臺(tái)開(kāi)發(fā)了AI寫(xiě)作智能體,網(wǎng)絡(luò)上也有許多教人用AI寫(xiě)作網(wǎng)文的課程。早在AIGC發(fā)展之前,就曾有博主在2021年用Excel制作了一個(gè)男頻網(wǎng)文的生成器,其中除了人物、地點(diǎn)、世界觀等基本信息,還包括了54個(gè)核心劇情“爽點(diǎn)”可以生成。
隨著智能體的不斷迭代升級(jí),AI與人類創(chuàng)作的界限是否依舊清晰?
王峰團(tuán)隊(duì)用AI為《天命使徒》生成的人物圖片。(受訪者供圖/圖)
邏輯漏洞,不夠“人”味
上百萬(wàn)字的《天命使徒》講了一個(gè)并不復(fù)雜的故事:一位青年修仙者,修行中在明暗兩極徘徊,最終選擇與愛(ài)人回歸平凡日常生活,不再孤獨(dú)求道。整個(gè)故事顯得有些套路,是市面上常見(jiàn)的帶有“玄幻”“修仙”“少年成長(zhǎng)”標(biāo)簽的男頻小說(shuō)。
創(chuàng)作過(guò)程采用“大模型+提示詞工程+人工后期潤(rùn)色”的方式完成。在閱讀了市面上流行的網(wǎng)文后,王峰團(tuán)隊(duì)設(shè)定了劇情框架、人物角色,并借助大模型輔助生成提示詞,再投給大模型生成文本,最后人工對(duì)文本進(jìn)行潤(rùn)色。
王峰發(fā)現(xiàn),保持文本的一致性是用大模型寫(xiě)長(zhǎng)篇小說(shuō)最難的部分。他和團(tuán)隊(duì)對(duì)市面上現(xiàn)有的各種大模型進(jìn)行測(cè)試,發(fā)現(xiàn)如果依靠大模型自身的邏輯能力來(lái)生成小說(shuō),目前的寫(xiě)作篇幅極限是三萬(wàn)字。
這源于AI寫(xiě)作與人類寫(xiě)作的邏輯有著本質(zhì)性的不同:人類寫(xiě)作是從頭開(kāi)始的線性寫(xiě)作,但AI是“模塊化寫(xiě)作”,在給到一段基本的提示以后,同時(shí)開(kāi)始各個(gè)部分的寫(xiě)作。這有點(diǎn)像是科幻電影《降臨》里外星文明的寫(xiě)作方式,文字寫(xiě)在一個(gè)圓圈里,句子可以從圓圈的任何一處開(kāi)始閱讀。
這樣的特性導(dǎo)致大模型在創(chuàng)作過(guò)程中經(jīng)常會(huì)出現(xiàn)人類作家很少犯的邏輯錯(cuò)誤,比如“故事進(jìn)行了一半,主人公就已經(jīng)被寫(xiě)死了,然后再到下一部分,他馬上又活過(guò)來(lái)了”。
因此,不同于短篇網(wǎng)文的創(chuàng)作,完成一篇邏輯通順的長(zhǎng)篇小說(shuō)需要大量的提示詞。為了訓(xùn)練大模型處理海量提示詞的能力,王峰團(tuán)隊(duì)一開(kāi)始就將小說(shuō)的目標(biāo)字?jǐn)?shù)設(shè)定在了一百萬(wàn)字。在輸入一段提示詞后,目前的大模型平均會(huì)生成500字的內(nèi)容,因此,百萬(wàn)字網(wǎng)文的創(chuàng)作,需要至少2000條提示詞。
提示詞的好壞至關(guān)重要。首先,在內(nèi)容上要告知大語(yǔ)言模型相對(duì)具體的情節(jié)邏輯,并且向它交代,希望它可以展開(kāi)想象力,角色的成長(zhǎng)很重要,劇情需要變化。“網(wǎng)文中會(huì)大量使用短句,多使用對(duì)話,對(duì)話要獨(dú)立成段,這些我也要告訴它。”團(tuán)隊(duì)成員魏萱是“靈咔靈咔”的項(xiàng)目經(jīng)理,曾在國(guó)內(nèi)頭部AI文本生成公司實(shí)習(xí)。
同時(shí),提示詞在風(fēng)格上也要和期待生成的文本語(yǔ)言相匹配!叭绻崾驹~比較具有表現(xiàn)力,那么它寫(xiě)的段落就會(huì)比較有表現(xiàn)力。如果想寫(xiě)清宮風(fēng)格的小說(shuō),提示詞的文風(fēng)就不要太現(xiàn)代,用一些古色古香的內(nèi)容,會(huì)更容易讓模型理解到你想要的風(fēng)格是什么!蔽狠娓嬖V南方周末記者。
另一個(gè)效果較好的方法是與現(xiàn)有的文學(xué)風(fēng)格進(jìn)行類比,“比如你想要陀思妥耶夫斯基一樣的風(fēng)格,或者你想要迪士尼童話一樣的風(fēng)格”!短烀雇健芬笪淖直M量直白、節(jié)奏快一些,更符合網(wǎng)文風(fēng)格。
針對(duì)這些要求,不同模型實(shí)現(xiàn)的效果很不一樣。王峰團(tuán)隊(duì)嘗試了五種以上的大模型,發(fā)現(xiàn)有的擅長(zhǎng)描繪細(xì)節(jié),但框架不夠完整;有的則邏輯性很好,但語(yǔ)言十分枯燥。王峰解釋,這和大模型訓(xùn)練的語(yǔ)料庫(kù)有關(guān),比如后者可能用的是經(jīng)濟(jì)、法律合同,他們最后從中選用了兩種。
真正拿到近1600頁(yè)的《天命使徒》時(shí),王峰非常震撼,“現(xiàn)在它寫(xiě)出的文本質(zhì)量還不好,但整本書(shū)的邏輯是沒(méi)問(wèn)題的,”他對(duì)南方周末記者說(shuō),“從這一刻,我們可以開(kāi)啟人機(jī)協(xié)作時(shí)代了。”
相較于成熟的人類網(wǎng)文,《天命使徒》的語(yǔ)言確實(shí)不夠有“人”味,行文中時(shí)不時(shí)夾雜著大模型的評(píng)點(diǎn):“在這個(gè)場(chǎng)面中,每個(gè)人的情緒都鮮明而獨(dú)特!薄霸谶@個(gè)瞬間,他們的服從是勉強(qiáng)的,他們的矛盾是明顯的,他們的權(quán)力博弈是激烈的!
王峰發(fā)現(xiàn),愛(ài)反思、愛(ài)總結(jié)是AI的一大特點(diǎn)。按照給定的提示詞生成文本后,大模型通常會(huì)補(bǔ)充一段總結(jié)。比如在一段打斗描寫(xiě)后,兀自出現(xiàn)了一段總結(jié),“他們彼此間的信賴關(guān)系在這危難之中顯得尤為強(qiáng)烈,他們互相扶持,共同面對(duì)這突如其來(lái)的危機(jī)。”不同的AI總結(jié)的角度也有微妙的區(qū)別:國(guó)產(chǎn)大模型的總結(jié)比國(guó)外的大模型通常更樂(lè)觀一些。
因此,大模型生成文本之后,人類作者額外要做的工作主要是刪除。
《天命使徒》的創(chuàng)作在一個(gè)半月內(nèi)就完成了。對(duì)于它的文學(xué)質(zhì)量,王峰有著冷靜的認(rèn)知,他給這本小說(shuō)打出的分?jǐn)?shù)是61分!鞍凑瘴宜吹降奈膶W(xué)作品的層次,這是層次最低的小說(shuō)!彼髨F(tuán)隊(duì)成員,堅(jiān)決不要在后期進(jìn)行過(guò)度潤(rùn)色,盡量呈現(xiàn)大模型生成的文本原貌。
當(dāng)AI創(chuàng)作平臺(tái)“靈咔靈咔”于2024年10月底推出時(shí),王峰給它制作的10部小說(shuō)打了70分,“大模型本身的發(fā)展非常之快”。
用AI生成長(zhǎng)篇小說(shuō)的平臺(tái)“靈咔靈咔”計(jì)劃于2025年年中投入大范圍使用。(受訪者供圖/圖)
“讓普通人也能寫(xiě)長(zhǎng)篇小說(shuō)”
在“靈咔靈咔”上,創(chuàng)作一部篇幅達(dá)到二三十萬(wàn)字的長(zhǎng)篇小說(shuō)只需幾個(gè)步驟:在初始頁(yè)面,點(diǎn)擊標(biāo)簽或者輸入文本來(lái)設(shè)定創(chuàng)作的網(wǎng)文類型,AI會(huì)生成小說(shuō)的基礎(chǔ)設(shè)定,涵蓋簡(jiǎn)介、劇情動(dòng)力以及主要角色。完成基礎(chǔ)設(shè)定后,智能體便會(huì)繼續(xù)生成章節(jié)大綱,最終生成完整正文。
比《天命使徒》的創(chuàng)作更進(jìn)一步的是,這其中的每個(gè)步驟,都可以進(jìn)行人工干預(yù),或者讓AI進(jìn)行輔助優(yōu)化。魏萱說(shuō),這讓使用者從單純的寫(xiě)作者變成了讀者和編輯,使用者的文學(xué)素養(yǎng)與審美變得更加重要,“相當(dāng)于是廚師做菜的時(shí)候,每次加鹽都讓你嘗一下味道,一直調(diào)到你覺(jué)得合適為止”。
王峰曾在華東師范大學(xué)教授“大語(yǔ)言模型與創(chuàng)意寫(xiě)作”課程,布置的作業(yè)包括讓同學(xué)寫(xiě)五萬(wàn)字的小說(shuō)。交上來(lái)的小說(shuō)文體不限,武俠、玄幻、同人都有,但他發(fā)現(xiàn),寫(xiě)得比較好的都是人工干預(yù)的部分高,搭建的框架足夠好,并進(jìn)行了進(jìn)一步的修訂。“高質(zhì)量的文本還是得有人工干預(yù)。對(duì)智能的理解,絕不是說(shuō)我啥也不管,閉著眼睛扔給AI,AI都給我完成得好好的!
在智能體的輔助下,寫(xiě)作變成了“人類給靈感框架、智能體寫(xiě)內(nèi)容”。甚至,也可以由AI起草一個(gè)框架,使用者來(lái)修改。
與AI互動(dòng)時(shí),魏萱發(fā)現(xiàn),AI生成的內(nèi)容會(huì)給她帶來(lái)啟發(fā),激勵(lì)她的寫(xiě)作意愿!氨热缥蚁朐谖恼吕锩嬲宫F(xiàn)某一個(gè)元素,但是我覺(jué)得這個(gè)元素好像不太清晰,我就去問(wèn)它,怎么展現(xiàn)比較好?它會(huì)給我提供大概四五個(gè)方案,我來(lái)選!
目前,ChatGPT、Kimi等大模型也支持用戶創(chuàng)建智能助手。魏萱曾創(chuàng)建過(guò)一個(gè)知心大姐姐角色的ChatGPT助手,給對(duì)方設(shè)定:“你是一個(gè)溫柔可愛(ài)的知心大姐姐,你會(huì)用你豐富的人生經(jīng)歷給我的想法很多支持和關(guān)注,你會(huì)溫柔地鼓勵(lì)我。”設(shè)置后,魏萱輸入“你好”,這位“知心大姐姐”回應(yīng)“小萱萱,你好呀”,配有一個(gè)笑臉的emoji。
“寫(xiě)作不再是一個(gè)沉默、艱苦的工作!蔽狠鎸(duì)南方周末記者說(shuō)。
從嘗試用大模型創(chuàng)作長(zhǎng)篇小說(shuō)伊始,王峰的目標(biāo)就是“讓普通人也能寫(xiě)長(zhǎng)篇小說(shuō)”。在他看來(lái),也許每個(gè)普通人都能想出一個(gè)故事,但真正付諸實(shí)踐時(shí),小說(shuō)如何展開(kāi)情節(jié)、如何描寫(xiě)沖突等,都需要想象力和意志力。
“雖然愛(ài)好文學(xué)的人那么多,但真正能寫(xiě)長(zhǎng)篇的在人口當(dāng)中可能達(dá)不到1%。但是有了智能體以后,我們能夠讓人口當(dāng)中60%-70%的人走入這扇大門(mén)。我覺(jué)得這就是意義!蓖醴鍖(duì)南方周末記者說(shuō)。
在王峰看來(lái),AI網(wǎng)絡(luò)文學(xué)是人類通往智能文學(xué)的一座橋梁。智能化寫(xiě)作在至少五年內(nèi)還看不到趕上人類作家的可能性,相比之下,網(wǎng)絡(luò)文學(xué)劇情更模式化,語(yǔ)言表達(dá)更為淺顯和直白,入門(mén)門(mén)檻較低,AI更有應(yīng)用空間。
隨著AI寫(xiě)作的發(fā)展,版權(quán)、抄襲、“洗稿”等問(wèn)題也不斷浮出水面。2024年7月,番茄小說(shuō)平臺(tái)要求作者簽訂“AI訓(xùn)練補(bǔ)充協(xié)議”,打算將作者的原創(chuàng)內(nèi)容用作語(yǔ)料來(lái)訓(xùn)練AI,引發(fā)了部分簽約作家的不滿與抵制。在海外,許多AI生成的“垃圾書(shū)”在亞馬遜網(wǎng)站上市,其中不乏誤導(dǎo)信息并冠上錯(cuò)誤作者,許多無(wú)辜作者因此“躺槍”。
王峰預(yù)測(cè),未來(lái)的人工智能小說(shuō)創(chuàng)作在數(shù)量上將變得極大豐富,隨之而來(lái)的是“垃圾產(chǎn)品非常多”,遴選好作品的機(jī)制因此變得重要。與此同時(shí),經(jīng)典文學(xué)的創(chuàng)作并不會(huì)消失,但判斷網(wǎng)絡(luò)文學(xué)好壞的標(biāo)準(zhǔn)已經(jīng)不同于主流文學(xué),未來(lái)智能文學(xué)的遴選機(jī)制也一定不會(huì)相同。
“說(shuō)不定目前智能文學(xué)被認(rèn)為的枯燥乏味的特點(diǎn),未來(lái)反而成為了某種標(biāo)準(zhǔn),”王峰說(shuō),“人工智能的力量沒(méi)有任何人可以預(yù)測(cè),我只知道這個(gè)力量是極大的,很難阻擋!
魏萱對(duì)AI寫(xiě)作有另一重顧慮,若不加以人工干預(yù),大模型可能延續(xù)人類既有的歧視與刻板印象。魏萱實(shí)習(xí)時(shí)所在的公司曾開(kāi)發(fā)一個(gè)對(duì)話體的大模型,她發(fā)現(xiàn),這個(gè)AI說(shuō)的話總是帶著侮辱人的色彩,“它總是說(shuō)‘你要跟我結(jié)婚,給我生孩子’!
人工智能行業(yè)已經(jīng)出現(xiàn)了如何促進(jìn)“AI for good(人工智能向善)”的討論,包括增加倫理的訓(xùn)練和標(biāo)注,讓大模型擺脫既有的偏見(jiàn)與歧視。目前,若非人為地要求,比較成熟的大模型已經(jīng)不會(huì)“吐臟字”了。“但是一些套路和成見(jiàn),比如總是要給男主角配一個(gè)美麗漂亮的女主角,你可能要明確地告訴它,才能讓它改變!蔽狠嬲f(shuō)。
南方周末記者 陳荃新
責(zé)編 李慕琰