百度AI技術升級 敢想一切就成真 AI打卡 瞬間環遊世界 人機交互 眼鏡化身全能助手
AI進行象棋對弈、AI完成素描繪畫、AI實現旅遊合影;AI應用小鎮打造出未來世界,生活、辦公、娛樂、出行、醫療等場景處處可見AI身影,助力人們的生活更加趣味與便捷……這是昨日在滬舉行的百度世界2024大會上的場景。當日,百度創始人李彥宏還發布兩大賦能應用的AI技術,不僅解決了大模型在圖片生成上的幻覺問題,還助力普通用戶「秒變」AI「程序員」。他說:「智能體是AI應用的最主流形態,即將迎來爆發點,大模型基本消除了幻覺,回答問題的準確性大幅提升。」●文/圖:香港文匯報記者 倪夢璟 上海報道
只需要上傳圖片,即刻生成旅遊景點照片。在AI應用小鎮內,「文心一言」展台的AI合照打卡活動吸引了眾多關注,北京故宮、上海東方明珠、四川竹林、嵩山少林……國內景點一應俱全。在大會現場,記者通過二維碼掃描小程序,上傳照片後,20秒後就出現在了選定的知名景點打卡地,與熊貓合影。而之所以能夠實現「花式打卡」,背後是百度自主研發的大語言模型不斷增強。據工作人員介紹,文心一言具備理解、生成、邏輯、記憶四大基礎能力,能夠輔助完成文本、圖片的生成以及數據處理任務,「通過AI合拍可以讓體驗者足不出戶體驗旅遊打卡的樂趣,相信這對於較少能夠出行的用戶來說,是一次不錯的體驗。」
在「智力」大比拚方面,AI象棋對弈機絕對是一個強悍的對手。AI應用小鎮內的兩台機器手臂正在對弈象棋,一台搭配文心大模型3.5,另一台則裝載了文心大模型4.0。「從結果上說,3.5版和4.0版對弈的話,4.0版本的『棋手』目前為止沒有輸過,這也印證着我們的大模型是在不斷升級,並取得了實質的成長。」該展台工作人員這樣介紹。
記者了解到,想要達到熟練下棋目的,基於現有大模型,需要進行數月的訓練,「它的好處是可以綜合大量的已有象棋數據,不僅可以與普通玩家對弈,還可以幫助職業棋手進行訓練,以目前的結果判斷,可能目前AI棋手的象棋實力已經超越大部分普通玩家。」
AI眼鏡助用家「邊走邊問」
全球首款搭載中文大模型的原生AI眼鏡——小度AI眼鏡昨天也正式亮相。據介紹,小度AI眼鏡作為人類的第一視角設備,可以通過捕捉視覺、聲音、位置等信息,實現「感官延伸」,化身實時「AI助理」。在不同應用場景內,AI眼鏡可以變身翻譯官、私人導遊、甚至情緒癒療師,提供多種類服務。工作人員說:「比如你可以通過語音交互,來讓AI眼鏡為你翻譯對話,或者通過拍照提煉資料筆記信息等,讓生活變得更加輕鬆。」
不僅如此,AI畫家可以迅速畫出圖像素描,AI教練可以指導體驗者做出正確的鍛煉動作……一個未來小鎮正在眼前。根據百度公布,截至11月初,百度文心大模型的日均調用量已經超過15億,相較一年前首次披露的5,000萬次,增長約30倍。李彥宏表示,智能體是AI應用的最主流形態,即將迎來爆發點,它將成為AI原生時代,內容、信息和服務的新載體。
iRAG技術生成超真實圖片
當日,李彥宏還公布了檢索增強的文生圖技術iRAG,它可以將億級圖片資源跟強大的基礎模型能力相結合,生成各種超真實的圖片,整體效果遠遠超過文生圖原生系統,去掉了「一眼假」的機器味。「隨着AI生成圖片的可用性大大提高,它的應用空間也隨即打開了。比如在品牌宣傳場景,以前拍這樣一組海報動輒需要一二十萬,甚至幾十萬,但是現在創作的成本接近於0。簡單說來,iRAG的商業價值體現在:無幻覺、超真實、沒成本,立等可取。」他說。
發布無代碼AI工具「秒噠」
另外,還有無代碼工具「秒噠」,它是一個由大模型和智能體組成的全新軟件,包括無代碼編程、多智能體協作以及規模化地調用各種工具等能力。使用者通過自然語言交互,就可以完成一整套系統的搭建,還可以做任意場景下的各種應用,李彥宏說:「應用的複雜度也會隨着我們技術的提升不斷提升。也就是說,只要有想法,你就可以心想事成。」