你是否曾經因為手機存儲空間不足而忍痛刪除一些照片?又或因照片文件太大,令傳送時間變長?照片在我們的生活中扮演着重要的角色,無論是記錄美好瞬間,還是分享生活點滴。然而,隨着照片數量的增加,存儲和傳輸這些照片變得愈來愈困難,這些都與照片的文件大小有關。那麼,有沒有一種方法可以讓照片「瘦身」,同時又不損失太多質量呢?今天,我們就來探討一下當傳統圖像壓縮遇上人工智能(AI)「黑科技」時,會發生什麼奇妙的變化。
在AI技術出現之前,圖像壓縮主要分為兩類:以PNG為代表的無損壓縮和以 JPEG 為代表的有損壓縮。
無損壓縮的代表PNG(Portable Network Graphics,便攜式網絡圖形)格式誕生於1996年,旨在提供一種無損壓縮的圖像格式。在壓縮過程中,PNG 首先對圖像數據進行預處理,通過預測編碼減少相鄰像素間的多餘信息,然後對預處理後的數據使用DEFLATE進行壓縮生成碼流文件。
PNG 的無損壓縮特性使其特別適合存儲需要保留完整細節的圖像。這種方法能夠確保在壓縮過程中不丟失任何原始數據,但導致生成的文件較大。
有損壓縮的代表JPEG(Joint Photographic Experts Group)是同名專家小組開發的圖像壓縮技術標準,其歷史可以追溯到1992年。在壓縮過程中,JPEG首先將圖像從RGB色彩空間轉換為更符合人眼感知的YCbCr 色彩空間,然後對每個顏色分量進行離散餘弦變換(DCT)以及量化處理,最後使用霍夫曼編碼對量化後的數據進行編碼。
這種有損壓縮方法通過減少圖像中的顏色信息和細節來減小文件大小。JPEG 的優勢在於其較好的壓縮效率和廣泛的兼容性,使其成為網絡分享和社交媒體平台的默認選擇。然而在高壓縮比下,圖像會出現較嚴重的失真和模糊及塊效應。
隨着AI技術的發展,圖像壓縮迎來了改革性的突破。AI通過深度學習,能夠自動學習大量圖像數據的特徵,從而優化壓縮算法。2025年發布的新一代圖像壓縮標準 JPEG-AI 就是這種技術的代表。JPEG-AI利用卷積神經網絡技術,在高壓縮比下仍能保持高質量的圖像。具體來說,JPEG-AI訓練神經網絡模型將輸入的圖片轉換到特徵域,然後對得到的特徵值進行變換以及量化處理,並統計特徵值的信息用於編碼。JPEG-AI需要從大量圖像數據中進行學習,從而得到了一套適用於圖像壓縮的網絡系數,能夠在不損失太多圖像質量的情況下,將圖片文件大小進一步減小。
AI圖像壓縮技術的實際效果非常顯著。與傳統的JPEG和PNG壓縮相比,JPEG-AI能夠保持同等/更少失真的同時大幅減小文件大小。隨着技術的不斷發展,AI 圖像壓縮技術將朝着更高的壓縮率和更廣泛的應用方向發展。未來,我們會看到 AI 圖像壓縮技術在虛擬現實、增強現實等領域的應用,為用戶帶來更加沉浸式的體驗。
同時,AI 圖像壓縮技術在減少數據存儲和傳輸能耗方面的意義也不容忽視。它將推動圖像處理領域的創新,為未來帶來更多可能性。
●潘翔 嶺南大學數據科學學院工業數據科學部研究助理教授

0 / 255