百度AI技術升級敢想一切就成真 AI打卡瞬間環遊世界人機交互眼鏡化身全能助手

香港文匯報要聞 2024-11-13

　　AI進行象棋對弈、AI完成素描繪畫、AI實現旅遊合影；AI應用小鎮打造出未來世界，生活、辦公、娛樂、出行、醫療等場景處處可見AI身影，助力人們的生活更加趣味與便捷……這是昨日在滬舉行的百度世界2024大會上的場景。當日，百度創始人李彥宏還發布兩大賦能應用的AI技術，不僅解決了大模型在圖片生成上的幻覺問題，還助力普通用戶「秒變」AI「程序員」。他說：「智能體是AI應用的最主流形態，即將迎來爆發點，大模型基本消除了幻覺，回答問題的準確性大幅提升。」●文/圖：香港文匯報記者倪夢璟上海報道

　　只需要上傳圖片，即刻生成旅遊景點照片。在AI應用小鎮內，「文心一言」展台的AI合照打卡活動吸引了眾多關注，北京故宮、上海東方明珠、四川竹林、嵩山少林……國內景點一應俱全。在大會現場，記者通過二維碼掃描小程序，上傳照片後，20秒後就出現在了選定的知名景點打卡地，與熊貓合影。而之所以能夠實現「花式打卡」，背後是百度自主研發的大語言模型不斷增強。據工作人員介紹，文心一言具備理解、生成、邏輯、記憶四大基礎能力，能夠輔助完成文本、圖片的生成以及數據處理任務，「通過AI合拍可以讓體驗者足不出戶體驗旅遊打卡的樂趣，相信這對於較少能夠出行的用戶來說，是一次不錯的體驗。」

　　在「智力」大比拚方面，AI象棋對弈機絕對是一個強悍的對手。AI應用小鎮內的兩台機器手臂正在對弈象棋，一台搭配文心大模型3.5，另一台則裝載了文心大模型4.0。「從結果上說，3.5版和4.0版對弈的話，4.0版本的『棋手』目前為止沒有輸過，這也印證着我們的大模型是在不斷升級，並取得了實質的成長。」該展台工作人員這樣介紹。

　　記者了解到，想要達到熟練下棋目的，基於現有大模型，需要進行數月的訓練，「它的好處是可以綜合大量的已有象棋數據，不僅可以與普通玩家對弈，還可以幫助職業棋手進行訓練，以目前的結果判斷，可能目前AI棋手的象棋實力已經超越大部分普通玩家。」

　　AI眼鏡助用家「邊走邊問」

　　全球首款搭載中文大模型的原生AI眼鏡——小度AI眼鏡昨天也正式亮相。據介紹，小度AI眼鏡作為人類的第一視角設備，可以通過捕捉視覺、聲音、位置等信息，實現「感官延伸」，化身實時「AI助理」。在不同應用場景內，AI眼鏡可以變身翻譯官、私人導遊、甚至情緒癒療師，提供多種類服務。工作人員說：「比如你可以通過語音交互，來讓AI眼鏡為你翻譯對話，或者通過拍照提煉資料筆記信息等，讓生活變得更加輕鬆。」

　　不僅如此，AI畫家可以迅速畫出圖像素描，AI教練可以指導體驗者做出正確的鍛煉動作……一個未來小鎮正在眼前。根據百度公布，截至11月初，百度文心大模型的日均調用量已經超過15億，相較一年前首次披露的5,000萬次，增長約30倍。李彥宏表示，智能體是AI應用的最主流形態，即將迎來爆發點，它將成為AI原生時代，內容、信息和服務的新載體。

　　iRAG技術生成超真實圖片

　　當日，李彥宏還公布了檢索增強的文生圖技術iRAG，它可以將億級圖片資源跟強大的基礎模型能力相結合，生成各種超真實的圖片，整體效果遠遠超過文生圖原生系統，去掉了「一眼假」的機器味。「隨着AI生成圖片的可用性大大提高，它的應用空間也隨即打開了。比如在品牌宣傳場景，以前拍這樣一組海報動輒需要一二十萬，甚至幾十萬，但是現在創作的成本接近於0。簡單說來，iRAG的商業價值體現在：無幻覺、超真實、沒成本，立等可取。」他說。

　　發布無代碼AI工具「秒噠」

　　另外，還有無代碼工具「秒噠」，它是一個由大模型和智能體組成的全新軟件，包括無代碼編程、多智能體協作以及規模化地調用各種工具等能力。使用者通過自然語言交互，就可以完成一整套系統的搭建，還可以做任意場景下的各種應用，李彥宏說：「應用的複雜度也會隨着我們技術的提升不斷提升。也就是說，只要有想法，你就可以心想事成。」

讀香港文匯報PDF版面

百度AI技術升級 敢想一切就成真 AI打卡 瞬間環遊世界 人機交互 眼鏡化身全能助手

百度AI技術升級敢想一切就成真 AI打卡瞬間環遊世界人機交互眼鏡化身全能助手