◆科大黃昊(左二)表示,FinSent 可能有助投資決策。 香港文匯報記者涂穴 攝
◆團隊計劃製作中文版本,方便散戶或投資者使用。

近日股市表現波動,不少投資者均需要一套精準分析工具,協助其投資決定。香港科技大學商學院商業及社會數據分析中心在近期推出上市企業金融情緒分析網站FinSent,利用大數據科技,自動分析公司財務報告,甚至能辨識公司財務報告及分析員會議所表達的情緒,協助投資者分析公司的取態、公司對市場看法等,為投資者於財務訊息之外提供嶄新分析角度。

科大FinSent應用NLP技術

該商學院副院長及會計學系副教授黃昊表示,FinSent金融情緒分析(Sentiment Analysis)網站由科大商學院商業及社會資訊分析研究中心開發,以自動化方式追蹤美國上市公司於其財務報告及分析員會議中所表達的情緒。FinSent為一項免費服務,利用自然語言處理(Natural Language Processing) 技術,辨識公司財務報告及分析員會議所表達的情緒,並以簡明易懂的方式展示,以助了解企業的訊息披露。

黃昊介紹,該網站會按使用者查詢的行業、公司及時期,顯示正面、負面、中性情緒的百分比,以及反映正面及負面情緒相差百分點的淨情緒(Net Sentiment Percentage),並以折線圖顯示歷年情緒變化。正數淨情緒百分比指正面情緒的陳述多於負面,反之亦然。用戶亦可以對不同公司的淨情緒百分比作出比較。網站可協助個人及機構投資者分析企業財務披露反映的情緒,數據每日早上更新。黃昊強調,FinSent 的資料可能有助投資決策,可供作為參考,惟有關資料並非亦不應視作投資建議。

分析模型月下載量逾20萬

該院資訊、商業統計及營運學系助理教授楊毅也提到,BERT是由Google開發、用於自然語言處理(NLP)的機器學習(ML)的框架,更有效從語境辨識文意。FinBERT是基於BERT開發的模型,利用三個金融相關語料庫進行模型訓練,包括企業年度及季度文件、財務分析師報告、收益電話會議紀錄,共49億個字詞,較BERT的33億個字詞多出約50%。有使用過FinBERT的大型投資銀行及金融機構人員,也表示 FinBERT對其機構專屬數據進行情緒分類,表現十分準確。用於情緒分析的FinBERT開源模型,在Huggingface上的月下載量超過20萬次,並在GitHub上也獲得超過200星評價。

年底擴展至港股數據庫

對於未來部署,黃昊表示,投資者對了解公司業務的前景興趣較濃厚,故此,FinSent日後將推出針對前瞻性陳述的情緒分數。團隊亦計劃年底把FinSent服務擴展到港股數據庫,並製作中文版本,方便散戶或投資者使用。黃昊補充,現階段有關服務免費,待再收集更多數據,及了解市場所需求後,下一步可行方向或以出售API(應用程式界面)方式及提供度身製造的數據分析,作為商業營運的基礎。