●黃天行(左)投入視頻平台發布,及積極與不同網紅名人合作。 受訪者供圖
●黃天行(左一)早前帶着項目參與大灣區品牌發展大會。 受訪者供圖

社會急速發展,符合現代人碎片化觀看習慣的短影音內容迅速崛起,而字幕作為引導觀眾理解內容的重要媒介,廣東話的字幕製作尤具挑戰性。作為社交媒體原生世代,19歲大學一年級生黃天行(Tim)看準相關需求,研發專為廣東話設計的人工智能(AI)字幕生成工具,並於去年創辦同名的CantoSub AI公司,期望解決內容創作者長期面臨的手動製作字幕耗時問題。隨着技術發展,該工具除可同時應對普通話及英語等多種語言,更提供一鍵翻譯功能,並針對港人中英夾雜、慣用俚語等獨特語言習慣,設計多樣化字幕風格。他透露,該技術已獲多名本港知名網紅支持及使用,他近期亦積極將項目帶往內地參展,期望能開拓市場,在科創領域走出自己的道路。

就讀香港理工大學電子計算及人工智能課程的Tim,早在小六的暑假已於YouTube開設Wong's Studio頻道發布網頁開發、應用程式設計及科技教學影片。作為長期製作視頻的創作者,他察覺到廣東話在技術支援上的不足:「持續創作過程中,為提升效率曾搜尋各種輔助工具,發現國外雖有眾多視頻上傳及文字轉錄解決方案,卻幾乎找不到專門服務廣東話的產品。正是洞悉這個市場缺口,促使我決心運用自身技術能力尋求突破。」

潮語俚語中英夾雜 準確轉書面語

為此,Tim致力研發CantoSub AI工具,但在開發過程中面臨諸多挑戰,包括技術層面上如何提升模型可控性成為關鍵難題,「系統偶爾會出現『幻覺字幕』現象,例如在無人說話或播放背景音樂時,因為模型數據問題而產生虛假字幕內容,顯示出根本無人提及的對話。這類問題在開發初期確實困擾我們,所幸現已成功克服。」

經多番調節,CantoSub AI已能將廣東話口語智能轉換為書面語的功能,其輸出的字幕均經過專業處理,形成規範的書面語 ;另系統更支援多種字幕風格調整,無論是潮流用語、俚語表達,抑或中英夾雜的語言習慣,皆能準確處理,並有一鍵翻譯成多種語言的功能。

抓準粵語產品缺口 迅速爆紅

技術雖然愈見成熟,然而Tim仍要面對市場推廣的考驗,包括如何清晰向消費者展示產品特色、與競品的差異化優勢,以及闡明為何這款工具能為用戶帶來更佳使用體驗。為此,Tim積極在社交平台宣傳,其中今年2月分享的帖子獲約24萬次瀏覽和近6千點讚,使CantoSub AI迅速爆紅,平台用戶數量顯著增加,並獲邀在YouTube頻道接受專訪,吸引了多名知名網紅支持並使用。

目前,Tim的團隊正積極擴展服務範圍,開發更多AI視頻製作工具,包括 AI音頻轉視頻、長片轉短片剪輯和 AI 生成縮略圖等功能, 致力於成為香港創作者的全方位AI製片助手,讓創作過程更加高效、專業和有趣。

Tim早前更毅然帶着CantoSub AI到東莞,參與大灣區品牌發展大會,期望進一步了解及開拓內地市場。他形容此行獲益良多,「感受到大灣區內地城市創業氛圍好濃,未來也想嘗試,多參加內地不同地方的創業競賽。」

●香港文匯報記者陸雅楠