21世紀新興媒體的蓬勃發(fā)展使人類傳播史進入了以個人化為核心、以移動互聯(lián)網(wǎng)為平臺、依賴于高科技的“第四紀”?;?ldquo;互聯(lián)”的Web1.0時代逐步演變?yōu)榛?ldquo;社交”的Web2.0時代,并且正在向基于“人工智能”的Web3.0時代邁進。
新聞機器人是人工智能技術(shù)在新聞業(yè)得以應(yīng)用的產(chǎn)物,主要指機器利用計算機程序?qū)ο鄳?yīng)的數(shù)據(jù)信息進行抓取,自動生成新聞文本,目前已在歐美主流媒體的財經(jīng)、體育、天氣類新聞報道中得到運用。本文通過對新聞機器人的溯源和現(xiàn)狀進行梳理分析,并對其發(fā)展趨勢和前景進行預(yù)測。在物聯(lián)網(wǎng)逐漸取代互聯(lián)網(wǎng)的大數(shù)據(jù)浪潮中,新聞機器人將逐漸從歐美國家推廣到發(fā)展中國家,從而帶動新聞業(yè)的職能分工和生產(chǎn)流程——乃至新聞的本體和屬性——的變革。
從CAJ到DDJ的概念演進
“計算機輔助新聞”(CAJ)是新聞機器人的前身,早的應(yīng)用案例可以追溯到1967年美國底特律市騷亂事件的新聞報道中。時任底特律自由新聞社記者的菲利普·梅耶使用大型計算機分析得出“在校大學生和高中輟學者參與騷亂的比例一樣高”的結(jié)論。1973年,已經(jīng)成為北卡大學教授的梅耶在其名著《新聞學》中預(yù)測,數(shù)據(jù)分析將成為新聞?wù)Z料系統(tǒng)的重要組成部分。此書多次再版,在新版中,他斷言“新一代記者應(yīng)當成為數(shù)據(jù)處理專家”。
20世紀80年代,隨著計算機技術(shù)的廣泛運用,數(shù)據(jù)處理成為新聞生產(chǎn)中的重要環(huán)節(jié)。學界對于“計算機輔助新聞”與“數(shù)據(jù)新聞”之間的關(guān)系爭論不休。有人認為,兩者僅是名稱不同,內(nèi)涵完全一致。另一些人則認為,數(shù)據(jù)新聞是對計算機輔助新聞的創(chuàng)新、發(fā)展與延伸。在實際操作中,這兩個概念都是指記者依靠數(shù)據(jù)處理系統(tǒng)對卷帙浩繁的公文和檔案進行分析與歸納,從中找到可以使用的新聞線索。在新聞寫作的過程中,人為主體,計算機為次要的輔助工具。
21世紀初,人類進入了大數(shù)據(jù)時代,各類文檔資源、軟件、版權(quán)的開放讓數(shù)據(jù)的獲取更加簡便、快捷、。“計算機輔助新聞”進一步演化為“數(shù)據(jù)驅(qū)動新聞”,并進一步細分為“算法新聞”、“自動化新聞”和“新聞機器人”。作為DDJ的主要品類之一,“新聞機器人”是指利用特定的語言程序,對所搜集的數(shù)據(jù)進行模式化的加工,將目標數(shù)據(jù)文本“嵌入”已有的模板,進而生成一套精密完整的計算機程序,用于新聞報道的“文本再生產(chǎn)”。
新聞機器人的發(fā)展歷程
2006年初,商業(yè)數(shù)據(jù)供應(yīng)商湯普森公司開始使用計算機程序?qū)ο嚓P(guān)財經(jīng)數(shù)據(jù)進行加工處理,并整合成完整的新聞報道文本,用以取代傳統(tǒng)財經(jīng)新聞記者所從事的事實類報道工作。湯普森的新聞機器人嘗試可謂毀譽參半。一些業(yè)內(nèi)人士對“新聞機器人”的效率表達驚訝和贊嘆,另一部分人則聲稱,“新聞機器人”只能陳述新聞事實,而無法對新聞數(shù)據(jù)后隱藏的細微差異做出合理、深入的分析。2009年,美國西北大學智能信息實驗室研發(fā)并推出了一款名為“統(tǒng)計猴”的軟件。該軟件能對棒球比賽中選手、比賽得分和獲勝率等數(shù)據(jù)進行抓取和篩選,并在12秒內(nèi)自動生成一篇完整的報道。2010年初,“統(tǒng)計猴”被運用于財經(jīng)報道中,該項目的兩位研發(fā)人員“下海”成立了“敘事科學”公司。
新聞機器人真正引起人們的關(guān)注,始自“地震機器人”在2014年3月發(fā)表在《洛杉磯時報》上的報道。“地震機器人”是該報記者肯·史文克所編寫的一套程序,能夠?qū)⒚绹卣鹁譁y量到的數(shù)據(jù)直接轉(zhuǎn)化、編寫成短消息。在不到五分鐘的時間里,新聞機器人所寫的報道就經(jīng)過人工校對,上傳到了《洛杉磯時報》的網(wǎng)站。
當前,歐美三家企業(yè)主導(dǎo)了整個新聞機器人行業(yè),分別是總部位于美國伊利諾伊州的“敘事科學”公司,總部位于美國北卡羅來納州的“自動化洞察力”公司和總部分別位于美國德克薩斯州、紐約州和法國巴黎的“伊索”公司。他們一方面開發(fā)出各具特色的軟件產(chǎn)品,供不同類型的新聞媒體機構(gòu)使用,另一方面,通過與傳統(tǒng)媒體機構(gòu)的合作深度參與新聞產(chǎn)品的開發(fā)。
“敘事科學”公司先后推出了多款軟件產(chǎn)品,以滿足不同受眾群體的需求。其中,初始版本“鵝毛筆”的自動敘述生成系統(tǒng)可抓取原始數(shù)據(jù),分析這些數(shù)據(jù)的意義,生成易于理解的信息內(nèi)容,然后運用自然語言來生成描述性或者敘述性的文本。它的升級版“鵝毛筆參與”是一款谷歌分析軟件,能夠簡單通俗地表達新聞業(yè)的關(guān)鍵指標和業(yè)績表現(xiàn)——例如,新聞內(nèi)容的關(guān)注度、網(wǎng)站訪問量和用戶細分信息,等等,還可進行歷史數(shù)據(jù)分析,預(yù)測行業(yè)的走向和趨勢。2016年初,該公司與視覺化軟件供應(yīng)商合作,推出了“鵝毛筆”系列的第三代產(chǎn)品——能將數(shù)據(jù)可視化產(chǎn)品轉(zhuǎn)換為自然語言的軟件。
除了開發(fā)軟件,“敘述科學”公司還與傳統(tǒng)媒體機構(gòu)展開合作,例如,他們與《福布斯》雜志合作,在其財經(jīng)類新聞寫作中大量使用該公司開發(fā)的軟件產(chǎn)品,并整合了一個專門由該軟件程序生成的新聞頁面,制作和發(fā)布事實類財經(jīng)新聞。
“自動化洞察力”公司則推出了自動新聞生成平臺,讓各家新聞機構(gòu)能夠設(shè)計出符合自身定位、體現(xiàn)其特色的機器寫作文本。例如,2014年4月,該公司推出了一款軟件產(chǎn)品,將市場營銷類機構(gòu)的分析性數(shù)據(jù)轉(zhuǎn)換成類似于人工處理過的報道,供各大媒體的財經(jīng)版面或欄目使用。
在媒體合作方面,2014年,該公司與美聯(lián)社達成合作協(xié)議,直接參與“企業(yè)季度營收”類新聞的寫作。美聯(lián)社稱,雙方合作后此類新聞的創(chuàng)作數(shù)量增長了近15倍,并進一步提出該技術(shù)“能讓新聞記者專心于深度挖掘,而不是枯燥的數(shù)據(jù)分析。”除了寫作外,他們還啟用“編輯機器人”來審查由軟件自動生成新聞報道。由此,美聯(lián)社成為家全面引入新聞機器人的傳媒機構(gòu)。
與前兩家公司相比,“伊索”作為一家橫跨歐美大陸的跨國公司,其軟件產(chǎn)品的核心競爭力在于多種語言的“自助服務(wù)”。一方面,該公司聲稱能將邏輯分析能力運用于數(shù)據(jù)中,并能以每秒3000頁的速度將其轉(zhuǎn)化成書面形式的短訊、新聞信等。在新聞寫作的過程中,其軟件產(chǎn)品還能夠透過數(shù)據(jù)解釋隱含的寫作動機和語境。另一方面,該公司提供包括英語、西班牙語、法語和德語在內(nèi)的多語言自動新聞生成服務(wù)。2016年3月,該公司推出了新一代產(chǎn)品“智識”,能將圖表數(shù)據(jù)轉(zhuǎn)換成多種語言表達的文字版本。