◆當香港文匯報記者輸入提問「撰寫動靜新聞的藏頭詩」時,「文心一言」給出的答案。 香港文匯報北京傳真
◆當輸入「香港報紙發行量」的問題時,「文心一言」給出的答案。 香港文匯報北京傳真。
◆香港文匯報記者要求「文心一言」用「紅梅落雪」作詩,它給出的答案較為優美。 香港文匯報北京傳真

香港文匯報記者參加首批內測 體驗超預期

香港文匯報訊(記者 朱燁、凱雷 北京報道)中國版ChatGPT——百度「文心一言」發布,放出首批「內測碼」,香港文匯報記者成為第一批拿到邀請碼的用戶,體驗這款大語言模型的實時測試反饋,總體而言,與ChatGPT相比,「文心一言」更懂中文,更懂中國文化,更懂中文邏輯,超出此前預期。而百度創始人李彥宏則稱,ChatGPT剛推出時反饋糟糕,「我一直在關注『文心一言』發布後的第一批內測反饋,目前看外界反饋與我的預期相符。」

更優秀中文理解 多模態生成能力

在3月16日下午百度舉行「文心一言」發布會後,市場熱度持續飆升。截至3月18日上午10點58分,「文心一言」企業版API調用服務測試的企業用戶突破9萬人,首日邀測超60萬人申請,與百度智能雲基於「文心一言」展開合作諮詢已達6,588條。與ChatGPT上市首日相比, 「文心一言」火爆程度遠超ChatGPT,從側面反應,中文世界對類ChatGPT的強勁需求。香港文匯報記者拿到首批內測邀請碼,通過測試感到「文心一言」具備基本的知識儲備和對答框架,對中文語義的理解比ChatGPT要更好,不僅具備文學創作、商業文案創作、數理推算等大語言模型較常見的優勢和能力,還表現出了更優秀的中文理解、多模態生成能力。

當香港文匯報記者要求「文心一言」用「紅梅落雪」作詩時,它給出的答案較為優美,比如「花開如雪,雪落亦香」等。當輸入提問「撰寫動靜新聞的藏頭詩」時,「文心一言」給出的答案為,「動若無人靜有容,靜觀萬物動亦同,新篇巨製驚天地,聞到長征又出籠。」而在ChatGPT裏輸入藏頭詩的要求,對方甚至讀不懂要求。

補齊回答事實問題「胡編亂造」短板

發布會的Demo演示中,「文心一言」準確回答了《三體》作者、電視劇角色扮演者等事實性問題,百度方面認為,與ChatGPT相比的不同之處在於,百度的搜索增強,補齊了生成式AI在回答事實性問題時常常「胡編亂造」的短板。

程序員:不完美但也不容小覷

除了在文學創作方面的優勢,香港文匯報記者感到,在以文繪圖方面,「文心一言」的表現也可圈可點。不過,「文心一言」對一些問題給出的答案依然不準確,也有不少同行吐槽其邏輯性差。比如,當輸入「香港報紙發行量」的問題時,「文心一言」給出的答案中將《明報》定義為非正式小報,顯然有失偏頗。ChatGPT對此給出的答案為,「在過去幾年中,香港的主要報紙包括,《南華早報》、《明報》、《文匯報》、《大公報》、《香港經濟日報》」等,並在最後總結稱「這些報紙的發行量可能會因年份、經濟形勢、競爭程度等多種因素而變化。」相對來說,總結更加全面,邏輯性較強。

在GPT-4發布後,受眾的期待再一次被拔高。據官方表示,GPT-4比上一代準確性更高,解決問題能力更強,可以處理超2.5萬字的文本,並支持圖像輸入。有資深程序員對香港文匯報表示,「文心一言」雖然不完美但也不容小覷,大家應該對創新多一些理解、寬鬆和鼓勵。