編發(fā)提要:生成式人工智能的爆炸式發(fā)展為其在新聞采編環(huán)節(jié)中的應用提供廣闊空間。但由于生成式人工智能訓練需要抓取海量信息等技術特征,應用其功能生產(chǎn)的新聞作品存在侵犯他人著作權(quán)的隱患。在現(xiàn)行法律框架下,需要新聞機構(gòu)及其從業(yè)人員規(guī)避侵權(quán)風險,創(chuàng)新著作權(quán)授權(quán)使用模式,以促進生成式人工智能技術發(fā)展與權(quán)利人利益的平衡。
近兩年,生成式人工智能(Artificial Intelligence Generated Content,縮寫AIGC)技術及應用的爆發(fā)式發(fā)展,沖擊著社會各行業(yè)的生產(chǎn)方式。由于生成式人工智能具有文本、圖片、音頻、視頻等內(nèi)容生成能力,與新聞內(nèi)容的傳播形式高度重合,又因其應用能夠大大降低技術門檻、提高生產(chǎn)效率,生成式人工智能在新聞領域應用的探索不斷擴展。
習近平總書記在《加快推動媒體融合發(fā)展 構(gòu)建全媒體傳播格局》中指出:“我們要增強緊迫感和使命感,推動關鍵核心技術自主創(chuàng)新不斷實現(xiàn)突破,探索將人工智能運用在新聞采集、生產(chǎn)、分發(fā)、接收、反饋中,用主流價值導向駕馭‘算法’,全面提高輿論引導能力。”進一步推動生成式人工智能技術在新聞采編環(huán)節(jié)中的應用是提高輿論引導能力的內(nèi)在要求,也將對新聞行業(yè)發(fā)展產(chǎn)生深遠影響。作為新聞行業(yè)的生產(chǎn)主體,新聞機構(gòu)應積極破除障礙、應對問題,推進生成式人工智能技術應用與發(fā)展。
由于生成式人工智能在訓練階段需要在互聯(lián)網(wǎng)抓取或由訓練者輸入海量數(shù)據(jù)、在應用階段需要輸入成品相關資料等技術特征,在當前法律法規(guī)框架下,存在侵犯他人著作權(quán)的可能。這恰恰是新聞機構(gòu)在從事新聞生產(chǎn)活動時應恪守的法律底線。因此,在生成式人工智能參與新聞生產(chǎn)實踐的同時,明晰權(quán)責,從源頭上警惕并防范生產(chǎn)的新聞作品侵犯他人著作權(quán),是新聞機構(gòu)從業(yè)人員在實踐中理應也必須高度關注的問題。同時,新聞機構(gòu)及其從業(yè)人員更應在人工智能語境下首先探索創(chuàng)新著作權(quán)授權(quán)和使用的模式,努力實現(xiàn)著作權(quán)權(quán)益和技術創(chuàng)新發(fā)展的平衡。
一、新聞采編環(huán)節(jié)應用生成式人工智能的可行性分析
2023年7月國家互聯(lián)網(wǎng)信息辦公室聯(lián)合六部委發(fā)布的《生成式人工智能服務管理暫行辦法》明確,生成式人工智能技術,是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關技術。而新聞的載體同樣是文本、圖片、音頻、視頻,生成式人工智能的生成能力正好可以滿足新聞生產(chǎn)的需求。同時,生成式人工智能生成速度快這一特點又能夠較好滿足新聞時效性要求。
從業(yè)界實踐來看,在媒體融合發(fā)展這場“馬拉松”式競爭中,生成式人工智能帶來拉平機構(gòu)媒體之間差距的可能,為媒體打開了新的戰(zhàn)略窗口期。生成式人工智能至少在以下幾個方面發(fā)揮價值,能夠降低人力成本、提高生產(chǎn)效率,成為一些新聞機構(gòu)“彎道超車”的關鍵。
一是在文字內(nèi)容生產(chǎn)方面。在事實消息類新聞的快速發(fā)稿方面,生成式人工智能有著十分明顯的優(yōu)勢。其能夠利用數(shù)據(jù)分析優(yōu)勢,提取海量數(shù)據(jù)中的關鍵信息,按照預設快速生成新聞稿件,滿足這類新聞時效性高的要求。目前,生成式人工智能已廣泛應用于天氣預報、體育比賽結(jié)果、財經(jīng)類新聞生產(chǎn)中。
而人物報道、解釋性報道、調(diào)查類報道、深度報道等顯然不能依靠生成式人工智能直接生成稿件。首先,這些報道的生產(chǎn)更加依賴新聞價值判斷,對新聞事件的敏感度、理解力,調(diào)查采訪技巧,新聞事實挖掘等記者核心能力要求較高,而不是僅停留在文字流暢、邏輯通順上。但生成式人工智能在此類新聞采編過程中,可以提供重復性高、較為繁瑣的信息收集整理、采訪錄音整理、文字潤色、校對等工作,以降低記者的工作強度。
二是在視頻內(nèi)容生產(chǎn)方面。隨著短視頻、互動視頻等產(chǎn)品廣泛占據(jù)受眾注意力時代的到來,報紙尤其是一些細分行業(yè)類報紙對視頻產(chǎn)品產(chǎn)出的短板愈加明顯,生成式人工智能的視頻生成技術恰恰是這類媒體借助技術跨越人才短板,發(fā)揮內(nèi)容更具深度優(yōu)勢的機遇。
在視頻新聞制作中,往往需要記者編輯花費大量時間進行素材挑選和剪輯等工作,這時生成式人工智能可發(fā)揮其算力優(yōu)勢,在海量素材中快速挑選合適的部分并進行剪輯,大大降低了記者編輯的事務性工作量,讓他們能夠?qū)W⒂趦?nèi)容的挖掘和創(chuàng)新。特別是在一些開展視頻新聞采集制作并不成熟的行業(yè)媒體,在新聞現(xiàn)場拍攝畫面不能完全滿足新聞制作或無法獲得第一手視頻素材的新聞報道中,需要大量使用積累素材和互聯(lián)網(wǎng)視頻素材,甚至一些演示性虛擬畫面。此時,生成式人工智能文生圖、文生視頻、圖生視頻等功能能夠滿足視頻新聞的報道需求。
二、生成式人工智能運用到新聞制作實踐中的侵權(quán)風險
在極大提升編輯記者工作效率,提升新聞報道生產(chǎn)力的同時,需要警惕的是,使用生成式人工智能的新聞作品是否含有他人知識產(chǎn)權(quán)內(nèi)容。
《生成式人工智能服務管理暫行辦法》從提供和使用、訓練兩個維度明確了生成式人工智能不能侵犯他人知識產(chǎn)權(quán)。其第四條第三款明確,提供和使用生成式人工智能服務,應尊重知識產(chǎn)權(quán)、商業(yè)道德,保守商業(yè)秘密,不得利用算法、數(shù)據(jù)、平臺等優(yōu)勢,實施壟斷和不正當競爭行為。同時,第七條明確規(guī)定,生成式人工智能服務提供者應當依法開展預訓練、優(yōu)化訓練等訓練數(shù)據(jù)處理活動,涉及知識產(chǎn)權(quán)的,不得侵害他人依法享有的知識產(chǎn)權(quán)。
生成式人工智能的基本技術路徑也分為兩個維度,在生成程序維度中,經(jīng)歷數(shù)據(jù)輸入階段、機器學習階段、內(nèi)容輸出階段;在內(nèi)容類型維度中,分為孿生內(nèi)容、伴生內(nèi)容、原生內(nèi)容。其中,最可能侵犯他人知識產(chǎn)權(quán)的階段,一是數(shù)據(jù)輸入階段,二是內(nèi)容輸出階段。最容易侵犯他人知識產(chǎn)權(quán)的內(nèi)容是孿生內(nèi)容和伴生內(nèi)容。作為與生成式人工智能生成作品聯(lián)系最為緊密的一種知識產(chǎn)權(quán),在考量其生成內(nèi)容是否侵犯他人著作權(quán)時,應從生成式人工智能訓練自動抓取和輸入的海量數(shù)據(jù)是否侵權(quán)、生成的內(nèi)容是否侵權(quán)兩方面來看。
?。ㄒ唬┯柧殧?shù)據(jù)侵權(quán)風險分析。知識產(chǎn)權(quán)的內(nèi)在邏輯是一種排他權(quán)利,是獨占或壟斷的專有權(quán)受到法律保護。生成式人工智能如果抓取大量互聯(lián)網(wǎng)公開信息進行訓練,其中就包含大量他人著作權(quán)內(nèi)容。
具體到新聞領域,《中華人民共和國著作權(quán)法》(以下簡稱“著作權(quán)法”)規(guī)定,單純的事實消息不受著作權(quán)法的保護。生成式人工智能使用互聯(lián)網(wǎng)上的海量事實消息進行文本訓練,依據(jù)輸入的新近發(fā)生的事實,形成新的事實消息,這一過程不存在侵犯他人著作權(quán)的情形。這也是天氣新聞、體育新聞等事實性報道能夠使用生成式人工智能報道的原因。
但隨著移動互聯(lián)網(wǎng)的發(fā)展、自媒體的興盛、全社會信息量的爆炸,受眾對新聞的需求不僅僅是“新近發(fā)生的事實”,更多的是了解發(fā)生事件前因后果,對各類信息甚至觀點的整合分析。因此,新聞業(yè)態(tài)越來越多地從單純事實消息向帶有信息篩選分析、調(diào)查、觀點等加注采編人員智慧勞動的新聞作品轉(zhuǎn)換。這些帶有獨創(chuàng)性表達的新聞作品是理應也正在受到著作權(quán)保護。此外,圖片新聞、視頻新聞因不屬于單純事實消息,也受到著作權(quán)法保護。
現(xiàn)行著作權(quán)法中,為平衡作品的創(chuàng)作與傳播,對一定限度的合理使用進行了規(guī)定。在合理使用范疇內(nèi),可不經(jīng)著作權(quán)人許可免費使用作品。目前,生成式人工智能的學習是否能適用合理使用規(guī)則,在國內(nèi)尚無定論。法學界對此眾說紛紜,其核心是如何平衡權(quán)利人利益和促進傳播的此消彼長的關系,以及和技術發(fā)展的關系。
如果生成式人工智能學習數(shù)據(jù)適用合理使用規(guī)則,則侵權(quán)問題迎刃而解,問題在于這樣就忽略了權(quán)利人的權(quán)益,不利于激發(fā)創(chuàng)作熱情。如果生成式人工智能訓練所使用數(shù)據(jù)不適用合理使用規(guī)則,則要得到權(quán)利人授權(quán)許可。在這種觀點中,對于普遍意義的著作權(quán),存在著辨別侵權(quán)、獲得著作權(quán)操作難度大,從而限制了傳播的問題。
2023年12月,《紐約時報》對OpenAI和微軟公司提起訴訟,指控OpenAI未經(jīng)許可使用其數(shù)據(jù)進行生成式人工智能訓練,侵犯了《紐約時報》的著作權(quán)。此后不久,美國8家媒體又一次對OpenAI和微軟公司提起訴訟,指控其在未經(jīng)許可的情況下,使用了它們的新聞作品來訓練生成式人工智能,要求賠償損失并停止侵權(quán)行為。據(jù)媒體報道,在這兩個訴訟之前,OpenAI也與一些媒體達成了版權(quán)協(xié)議,付費使用新聞作品進行生成式人工智能訓練。目前,國內(nèi)尚無媒體和人工智能公司糾紛案件發(fā)生。雖然這些國外案件還未審結(jié),但已能夠看出,從商業(yè)角度考量,使用版權(quán)新聞作品訓練生成式人工智能存在巨大利益空間。這是新聞機構(gòu)不能忽視和輕易放棄的權(quán)益。同時,妥善解決生成式人工智能訓練數(shù)據(jù)合規(guī)性問題也是新聞機構(gòu)使用其進行生產(chǎn)的前提。
?。ǘ┥蓛?nèi)容侵權(quán)風險分析。相較于訓練數(shù)據(jù)不公開帶來的侵權(quán)隱形性,生成內(nèi)容侵權(quán)更容易判定。一旦生成內(nèi)容公開,就有條件通過作品的相似性認定其是否侵犯他人著作權(quán)。
在此層面,我國已有著作權(quán)侵權(quán)司法案例。2024年2月,廣州互聯(lián)網(wǎng)法院審結(jié)一起某人工智能平臺侵犯奧特曼系列作品著作權(quán)案件。該案件中,當用戶要求該平臺提供的AI繪畫功能生成奧特曼相關圖片時,生成的形象與原告享有著作權(quán)的奧特曼形象構(gòu)成實質(zhì)性近似。法院認定,該平臺侵犯了原告對涉案作品的復制權(quán)、改編權(quán)。通過該案例可以看到,侵權(quán)生成物一方面來源于訓練數(shù)據(jù),另一方面也與使用者輸入指令高度相關。
從技術角度看,生成式人工智能在數(shù)據(jù)輸入階段后,經(jīng)過機器學習階段,到達內(nèi)容輸出階段。內(nèi)容輸出階段是生成程序的終局環(huán)節(jié),根據(jù)指令輸入與內(nèi)容輸出的對應程度高低,生成式人工智能可以將內(nèi)容輸出依次分為孿生內(nèi)容(AI對使用者輸入指令的同比例復制)、伴生內(nèi)容(AI對使用者輸入指令的差異化表達)、原生內(nèi)容(AI對使用者輸入指令的創(chuàng)造性表現(xiàn))。這再次印證了,生成式人工智能的著作權(quán)侵權(quán)風險一方面來源于未經(jīng)授權(quán)的訓練數(shù)據(jù),另一方面來源于用戶輸入內(nèi)容。
在著作權(quán)法框架下審視人工智能生成的新聞作品的侵權(quán)問題,著作權(quán)法規(guī)定,為報道新聞,在報紙、期刊、廣播電臺、電視臺等媒體中不可避免地再現(xiàn)或者引用已經(jīng)發(fā)表的作品,可以不經(jīng)著作權(quán)人許可,不向其支付報酬,但應當指明作者姓名或者名稱、作品名稱,并且不得影響該作品的正常使用,也不得不合理地損害著作權(quán)人的合法權(quán)益。合理使用制度雖然“豁免”了生成式人工智能新聞作品的再現(xiàn)或引用時對他人著作權(quán)的財產(chǎn)權(quán)利,但規(guī)定應指明作者姓名或者名稱、作品名稱,實則仍然保護著作權(quán)人的人身權(quán)利。此外,《最高人民法院關于審理著作權(quán)民事糾紛案件適用法律若干問題的解釋》第十六條規(guī)定,通過大眾傳播媒介傳播的單純事實消息屬于著作權(quán)法第五條第(二)項規(guī)定的時事新聞。傳播報道他人采編的時事新聞,應當注明出處。這也要求新聞機構(gòu)和新聞采編人員應高度關注、嚴格要求生成式人工智能生成的新聞作品中引用他人新聞作品在內(nèi)的所有著作權(quán)作品的格式,以防侵犯他人著作權(quán)的人身權(quán)利。
三、生成式人工智能應用于新聞采編的防侵權(quán)應對
互聯(lián)網(wǎng)抓取內(nèi)容看似“免費”,實則摻雜大量擁有著作權(quán)的內(nèi)容。
排除訓練數(shù)據(jù)著作權(quán)侵權(quán)風險,才能促進生成式人工智能技術長足發(fā)展。首先,法律層面應盡快通過修法或判例明確生成式人工智能使用著作權(quán)內(nèi)容規(guī)則,為生成式人工智能技術發(fā)展和應用“撥開迷霧”。其次,將生成式人工智能成熟應用于新聞采編實踐,還需要新聞行業(yè)的共同努力,積極應對。
在現(xiàn)行法律法規(guī)框架下,取得權(quán)利人授權(quán)是最可行的解決方式之一。雖然一般著作權(quán)人分散的特點導致了生成式人工智能取得海量權(quán)利人授權(quán)的難點,但新聞作品相較于一般著作權(quán)人,有著天然的集中優(yōu)勢。由于歷史上大量新聞相關數(shù)據(jù)由新聞機構(gòu)掌握,授權(quán)使用方式獲得數(shù)據(jù)有更大可能性和更多路徑。著作權(quán)法在第三次修正中規(guī)定,報社、期刊社、通訊社、廣播電臺、電視臺的工作人員創(chuàng)作的職務作品,作者享有署名權(quán),著作權(quán)的其他權(quán)利由法人或者非法人組織享有。這種集中擁有著作權(quán)的情形,為創(chuàng)新授權(quán)方式提供了可能。
筆者認為,我國各級新聞媒體機構(gòu)組織聯(lián)系較為緊密,可以由行業(yè)協(xié)會牽頭,以新聞機構(gòu)聯(lián)盟為紐帶,建立類似于專利池運營模式的版權(quán)池。版權(quán)池匯集大量新聞文字數(shù)據(jù)、新聞圖片和新聞視頻,以集體授權(quán)方式,將新聞作品數(shù)據(jù)有償授權(quán)給生成式人工智能公司使用,用于訓練專門的新聞作品生成式人工智能以及面向社會大眾使用的生成式人工智能。新聞機構(gòu)可向生成式人工智能公司購買生成式人工智能服務用于新聞生產(chǎn)。此外,新聞機構(gòu)也可與生成式人工智能公司共同探討簽署數(shù)據(jù)授權(quán)和產(chǎn)品使用互換等各類權(quán)益交換協(xié)議。參考我國一些媒體聯(lián)盟與互聯(lián)網(wǎng)平臺有關新聞作品授權(quán)使用的實踐,例如2019年中國財經(jīng)媒體版權(quán)保護聯(lián)盟與“學習強國”學習平臺簽訂了《戰(zhàn)略合作備忘錄》,雙方達成先授權(quán)后使用的協(xié)議,版權(quán)聯(lián)盟協(xié)調(diào)成員單位將其公開刊發(fā)的新聞作品及其他相關作品(文字、圖片、音頻、視頻),授權(quán)“學習強國”學習平臺免費轉(zhuǎn)載使用,而“學習強國”學習平臺將以適當方式為轉(zhuǎn)載的聯(lián)盟成員單位所刊發(fā)作品提供免費展示和推廣服務。
此方式將人工智能訓練數(shù)據(jù)集限定在固定的新聞數(shù)據(jù)上,無需生成式人工智能抓取互聯(lián)網(wǎng)數(shù)據(jù)進行訓練,一方面避免了權(quán)屬之爭,從根本上解決生成式人工智能產(chǎn)生的新聞作品涉嫌侵權(quán)的問題,打破生成式人工智能訓練數(shù)據(jù)量不足的障礙,促進技術發(fā)展和應用,為新聞機構(gòu)提供更智能、更專業(yè)化的生成式人工智能工具。另一方面,由于新聞機構(gòu)在新聞報道中使用審校制度、堅持新聞真實性等原則,這一版權(quán)池方式收集和利用的數(shù)據(jù)集相較于廣泛互聯(lián)網(wǎng)信息更具真實性和準確性,也能在一定程度上解決生成式人工智能生成新聞作品誤用虛假消息帶來的不準確、不可信問題。此外,結(jié)成版權(quán)池更利于新聞機構(gòu)與生成式人工智能公司進行議價,有利于新聞機構(gòu)的版權(quán)運營和變現(xiàn)。所以,在生成式人工智能訓練數(shù)據(jù)普遍意義的著作權(quán)權(quán)屬爭議未塵埃落定之前,新聞行業(yè)完全可以先行動起來,掌握技術應用先機。
另外,對于新聞采編工作者來說,使用生成式人工智能時,應以審慎態(tài)度謹防著作權(quán)侵權(quán)發(fā)生。人工采編新聞作品內(nèi)容完全在編輯記者的掌控中,所以對于嚴格引用其他作品或時事新聞的格式可以準確控制。由于生成式人工智能訓練數(shù)據(jù)、訓練過程的不可知性,生成物的侵權(quán)部分不容易被察覺,這就要求編輯記者在使用生成物時嚴格審校,謹慎對涉及他人著作權(quán)部分進行甄別。此外,在向生成式人工智能輸入原始素材時,也要保證輸入內(nèi)容不侵犯他人著作權(quán),同時要求生成式人工智能對使用的他人新聞作品注明出處。
《生成式人工智能服務管理暫行辦法》第五條規(guī)定,鼓勵生成式人工智能技術在各行業(yè)、各領域的創(chuàng)新應用,生成積極健康、向上向善的優(yōu)質(zhì)內(nèi)容,探索優(yōu)化應用場景,構(gòu)建應用生態(tài)體系;采取有效措施提高訓練數(shù)據(jù)質(zhì)量,增強訓練數(shù)據(jù)的真實性、準確性、客觀性、多樣性。從促進技術發(fā)展和應用的角度來看,新聞機構(gòu)及從業(yè)人員應以主動擁抱的姿態(tài)來面對生成式人工智能新聞技術發(fā)展。在新聞實務中,記者和編輯是AI生成內(nèi)容的第一把關人、第一責任人,要清晰認識到AI的能力邊界和潛在風險,堅持底線思維,避免過度依賴和不當使用。新聞機構(gòu)將生成式人工智能應用于新聞采編工作時,應進一步梳理使用規(guī)則和審核流程,以制度化手段規(guī)避潛在侵權(quán)風險,避免不當使用。對于生成式人工智能帶來的知識產(chǎn)權(quán)侵權(quán)等問題,在相關法律法規(guī)尚無更為明確的界定和規(guī)制前,全新聞行業(yè)應在不違反現(xiàn)行法律法規(guī)前提下,盡可能打破藩籬,平衡版權(quán)權(quán)益和技術發(fā)展的關系,以更為積極的態(tài)度尋求有利于技術發(fā)展的解決方案。
(參考文獻略)
