導語
經濟學家保羅·克魯格曼曾說“經濟蕭條、通貨膨脹、戰爭都會讓一個國家貧困,唯有生產率的提高可以讓它富裕起來。”提高人類的生產率,是技術發展不懈的追求,尤其是提高生產率的技術,無論是機械還是自動化,或多或少都涉及對勞動力的節約和替代。
隨著LLM能力的進化與行業標準化體系的建立,2025年已然成為AI Agent從概念驗證到規模落地的關鍵轉折點,也是AI Agent規模化落地的關鍵一年,AI Agent正在改變企業的生產方式和交互模式,它不僅是技術的突破,更是企業戰略升級的關鍵。企業應優先在高頻、規則明確、數據豐富的場景試點AI Agent,逐步積累經驗,最終實現全鏈條智能化升級。
一、大模型的知識處理能力
01新技術的使能效應
大模型是AI歷史的突變和涌現,從1956年達特茅斯學院的人工智能會議算起,人工智能歷史已接近70年。在機器學習中,模型作為核心概念,本質是對函數映射的描述何抽象,通過對模型進行訓練何優化,可以得到更加準確和有效的函數映射。建立模型的目的,是從數據中找到一些規律和模式,用這些規律和模式,預測未來的結果。模型的復雜度越高,模型越容易過擬合。模型參數越多,意味著該模型可以處理更復雜、更豐富的信息,具有更高的準確性和表現力。因此,超大模型的訓練和調整需要極其巨大的計算資源和數據量級、更加復雜的算法和技術、大規模的投入和協作。
在中國,AI大模型的主要代表是阿里通義千問、百度文心一言、華為盤古、字節豆包,這些模型的共同是:需要在大規模數據集上進行訓練,基于大量的計算資源進行優化和調優,借助大模型,深度學習算法可以更好的處理這些任務,提高模型的準確性和性能。
經濟學家保羅·克魯格曼曾說“經濟蕭條、通貨膨脹、戰爭都會讓一個國家貧困,唯有生產率的提高可以讓它富裕起來。”提高人類的生產率,是技術發展不懈的追求。而提高生產率的技術,無論是機械還是自動化,或多或少都涉及對勞動力的節約和替代。
無論是在手工時代,還是工業革命時期,新的技術突破,也會帶來全新的產品和服務。19世紀30年代修建的蒸汽機車和鐵路;20世紀10年代的汽車和公路建設;21世紀10年代的智能手機和移動互聯網服務,都是巨大的新市場和蛋糕。重要的是,新的產品同樣會促進其他行業產品的流通。新崗位的就業數量與市場規模成正比,新技術要打開新市場,才能源源不斷的增加崗位,來解決舊崗位被技術替代解決的失業問題。工業革命是在1840年后進入的良性循環,1850年工廠發揮規模經濟優勢,刺激蒸汽機的應用,催生密集型的新崗位。新技術的使能效應過程中,呈現了兩個關鍵特征,分別是生產體系和人力教育對技術的主動適應性。
圖1: 新技術的使能效應圖
回顧幾次工業革命,技術對生產率的跨越提升,均需要生產流程圍繞新技術進行重構。
早期的印刷術改變獲取、保存、傳播知識的方式,促進了知識的交流,百年后的大語言模型再次改變了人類的認知過程。無論是印刷術還是互聯網技術,都提高了知識傳播的數量和質量,大模型的出現改善了信息的互動方式,有效的在場景中運用,從記憶、理解、應用、分析、評價、創造等六個層次中,大模型與大腦在知識處理中不同層次都各有優勢,人們知識處理的范式轉換,由于坐擁全人類精選知識作為預訓練輸入,大模型經過RL、監督學習、推理等多種能力后,它將更全面的參與到業務生產中。未來的科研和發明,都會有大模型的深度參與和助力。
大模型可以作為私人助手,幫人們高效完成工作,也可以自主平等協作,完成不同級別的業務流程。
圖2:未來無人企業開會的變化/不同級別的業務流程
02數字時代的智能基座:預訓練模型;算法皇冠上的明珠:生成式模型
當我們擁有了高質量數據和算力后,算法可加深解析數據,能夠精準定位關鍵信息并生成決策方案,減少算力消耗,優化資源利用,通過遷移學習等技術,將已有知識遷移到新任務中,能減少訓練時間和計算資源消耗,驅動算力發展效率。?三者協同作用,共同推動AI技術進步。
預訓練模型:預訓練在算法大模型領域是革命性的技術范式,核心價值在于自監督學習海量數據知識,可為下游提供強大的基礎能力。若將預訓練比喻為神經網絡模型的練習題,在預訓練期間,模型會根據預測結果進行反向傳播,調整模型參數來提高模型的準確性。這個過程很像做練習題,每次的訓練都可以讓模型更好的掌握語言知識和技能,提高下一次預測的準確性。
企業在訓練神經網絡模型中,都將對模型進行參數優化,讓模型在預測任務中表現準確,這樣的反向傳播,利用誤差信號來更新模型參數,以便讓模型更好的擬合訓練數據。同時,利用梯度下降算法更新模型參數,對參數進行微調,減少誤差,提高模型預測準確性。反向傳播與算法梯度下降的迭代,不斷調整參數,提高模型在預訓練上的表現,為模型的預測任務提供準確結果。對比傳統方式,預訓練將重構AI開發范式,統一基礎模型+微調、調用API、小時級部署,開發成本降低10倍以上。
整個過程是深度學習、神經網絡模型學習和優化的關鍵,核心機制為突破數據標注瓶頸、實現通用能力遷移、構建壓縮理解生成表征能力、涌現復雜推理能力(參數超千億,模型將突破0樣本學習、復雜推理)等。它是一個技術杠桿,將技術遷移通用智能化,是AI工業化的基礎、可降低AI邊際成本,支撐AGI核心底座。
生成式模型:生成式模型是算法領域的革新突破,AI感知到認知的躍遷,不止是“生成逼真內容”,它是一種對數據本質和世界規律進行深度理解和建模的能力。它的目標是建模逼真真實數據的復雜概率分布,成功生成,意味著模型真正捕獲了數據的關鍵特征、變量間的依賴關系、數據生成的底層物理和語義規則。最大的價值就是全新、符合特定分布的、被約束的特定樣本(圖形、音頻、文本、代碼、視頻、分子結構等)。打破不同數據類型的壁壘,還可創造出跨模態生成。
生成式模型賦予算法革新,提升判別模型能力、推動模型可解釋性、促進多模態融合,也是實現跨模態理解和轉換的核心技術,進一步加速認知能力的“統一智能體”發展。
可見,投資算法是提升數據資產價值和最大化算力投資回報率的關鍵戰略。理解算法在推動數據、算力發展的作用,對于構建高效、可持續的AI基礎設施至關重要。
二、大模型產業解析
01大模型優化的GPU和云服務
一切數據處理都要經過基礎設施廠商之手,這些決定了產業回報。每秒的浮點運算次數成了生成式AI的命脈。GPU在深度學習中非常重要相比CPU,GPU具有更大量的并行處理能力,特別適合處理深度學習中大規模矩陣運算,可以讓模型的訓練和推理過程獲得顯著加速。
更高的計算力,與以往的深度學習模型相比,大模型具有更多的參數和更大的模型結構,隨著模型的擴大,計算復雜度也將呈現指數級增長。比如人臉識別的主流算法Deepface和A rcfacec參數規模在幾百萬和一億之間,而大模型的參數規模可達到十億,甚至千億,參數規模就像渾厚的內力。
在大模型進行商業化后,推理成本將成為業務邊際成本的重要部分,需要對推理業務在GPU上進行加速優化,從而降低成本。這也代表企業需要更大的顯存容量、更快的顯存帶寬、更高效的集群通信能力。大模型供應商進行預訓練和微調時,需要GPU,行業用戶應用時,利用私域數據進行模型微調時,需要GPU,最終應用時,還需要GPU進行推理。
大模型時代,算力的重要性毋庸置疑,模型的參數規模比以往的深度學習模型大的多,在訓練和推理中需要消耗巨大的計算資源和時間。分布式的深度學習框架便成了大模型最重要的軟件基礎設施。
當大模型加入圖像、視頻等多模態數據之后,模型規模、算力要求、訓練時長都會進一步提升。大規模計算、數據并行計算、容錯和恢復機制、高效的資源利用的難題,將讓分布式深度學習框架的重要性,在多模態條件下更加凸顯。
在算力、數據、算法的三要素中,大模型產業通過硬件基礎+分布式框架,重點解決算力問題后,數據的數量與質量,便成了大模型訓練的性能影響因素。預訓練中,數據常常可通過購買、合作、抓取等方式,并進行數據清洗,無需人工標注。但,進入后階段,RL與微調時,都需要人工標注和樣本數據,這些數據獲取,一方面是專業人士數據標注,以及采購專業數據公司和云廠商數據服務;另一方面是獲取合規性的公域或三方數據、接入企業私域數據;最后是搜索用戶使用過程中的反饋,這些數據加入訓練,大模型的性能和使用體驗,將得到極大提高,也將啟動數據飛輪,走向自我強化的循環。
圖3:LLM的數據飛輪圖
除了模型參數比拼,智能體正在定義人機協作邊界
落地實踐中,算力資源的高需求與技術難題相互交織、雙重凸顯。其中,Agent架構相較于傳統AI產品呈現出更為突出的算力消耗特征–單次任務處理所需的Token數量可飆升至十萬量級,這一現象主要歸因于其對長上下文的理解分析、多Agent間的交互通信機制、復雜的驗證流程以及多模態融合應用場景的綜合需求。以Manus平臺為例,其依托Claude 3.7 Sonnet模型執行單次任務時,不僅產生超過10萬個Token的數據交互量,更伴隨約2美元的成本支出。
從技術維度審視,該領域正面臨三大核心挑戰:自然語言的模糊性引發的語義意圖誤判問題、多智能體協作中存在的群體思維趨同與利益分配失衡現象,以及模型生成內容可能出現的事實性錯誤(即“幻覺”效應)。針對這些瓶頸,學術界積極探索貝葉斯統計實驗設計與分層式系統架構等創新路徑進行優化;而在產業界,則普遍采用RAG(檢索增強生成)技術方案來有效抑制幻覺現象,典型如醫療健康領域通過整合專業知識庫顯著提升了輔助診斷系統的精準度。
02模型即服務層(MAAS)
大模型的產業核心是MAAS層,我們現在使用的大模型應用均是這一層模型,通過企業服務模塊的應用程序接口形式,實現對話、寫作、分析、寫代碼等各種功能。面向應用開發者多功能調用,包括模型推理、微調訓練、強化學習訓練、插件庫、私域模型托管等。
被開發者常應用的是開源模型,其源代碼、模型數據、模型訓練過程內容,均公開可用,不同的開源模型,可規定不同的內容開放范圍和使用場景,不一定百分百開放。對比閉源模型,閉源模型商業化程度高,產品完善、模型性能更佳。開源模型可以降低模型的二次開發門檻,充分利用AI大廠預訓練計算集群,規避算法調優、無需清洗龐大數據,有助于領域應用的廣泛應用和普及,開發者以及社區驅動了開源模型的創新和改進,群體智慧更快的發展(Meta?LLaMA等擴展出來的模型成為了生成式預訓練的典范).
LLM需創造價值,若應用層無法實現商業價值和客戶價值,整個大模型將失去持續發展的動力。面向服務,LLM最基礎的能力便是模型推理,微調訓練(幫助企業適應特定任務和領域、定制應用)、強化學習、模型裁剪(幫助企業特定場景的規模化部署)、私域模型托管、插件庫(幫助企業獲得最新、最私密、少有的訓練數據、執行指定操作等)。應用層擁有良好的創新和價值,為各行各業將帶來智能業務場景上的諸多可能。
例如:
Character.ai端到端自建大模型個性化人機聊天應用:
特點:用戶選擇不同的角色,歷史上的名人/動漫人物/專業屬性的角色;用戶可以自建角色,后續溝通中產生“你的聊天對象認識你”。
商業模式:實現”前向用戶付費+后向廣告“雙重模式,支持付費用戶和免費用戶共存。
市場價值:取決于定位人群,未來每個孩子在AI中陪伴中成長,AI將成為旅程伴侶。
競爭壁壘:自建大模型的架構和訓練方法;特色運營,如何利用特色、名人、文化屬性,結合社交、趣味,產生傳播;快速形成規模,降低獲客成本。
Cocounsel AI?法律助手
特點:基于本地文檔庫的文件問答、法律法規、內容檢索、法律備忘錄、協議關鍵信息總結、合同數據提取、風險條款修改等功能。
商業模式:根據使用的技能數量和委托給Ai的工作量,按次付費、訂閱付費,為獨立、公司內部、大小律所服務。訂閱付費的方式,產生持續產業流,優質體驗保證續費率,持續擴大規模。
市場價值:龐大的、最新的案例法和法規訓練,生成的AI輸出具有難以置信的可靠性,以及高驗證。
競爭壁壘:大量專業的模型訓練和微調;快速累積數據,在垂域領域搶先市場先機;行業的深厚積累,高頻次使用率。
三、大模型應用與行業結合,提高現有生產力,是最落地的商業
新技術的引入和發展,勢必帶來新的產品與服務形態。由于大模型具有跨行業的通用性,通過自然語言、API系統對接交互手段,支持多樣化的使用方式。因此千行百業落地大模型應用時,會因適應場景能力、成熟度、企業應用時間、企業性質的不同,經歷不同階段。
第一階段:幫助員工提高工作效率和質量。大模型的產出歸屬于個人,員工也需為大模型產出質量負責。為企業探索大模型業務場景的應用成熟度、效率提升、模型缺陷、負面影響等,用于評估大模型價值,整合體系,為企業的進一步決策提供價值參考。
企業需注意的是,內部核心數據的保密,選擇大模型服務商提供的私域專有模型,部署專用服務器,確保內部數據不進入公域大模型訓練數據集中。此時AI:人類=1:1
第二階段:面臨業務流程調整和組織變革。大模型嵌入到了企業業務流程中,獨立承擔工作職責,可貢獻全局性的利益,產出歸屬與企業。LLM與人工形成協作關系,同時可接受監督和指導。
需注意的是,要充分利用模型能力,調整和優化自身流程,關注大模型對員工的影響,調整業務流程和職能崗位,設置好組織機制。為進一步加大效果和產出,還可借助插件完成二次開發、讀取、查詢本地數據;包括模型微調訓練、上下文學習、定制化、評估業務環節的信息量和容錯率。因地制宜,評估業務各個環節大模型應用成熟度和優先級。
第三階段:少量企業有能力嘗試的階段,讓大模型的多模態能力充分釋放,結合企業的全新業務模型設計產生顛覆性創新,重新設計業務,從根本上改變業務運作方式。這也將讓企業的AI能力更上一層樓。
企業需從技術、產品到市場、商業進行全盤策劃,創建新的商業模式,它也是大模型產業應當追求的方向。
智能體將大模型擴展到實際任務框架中
技術驅動中,隨著多模態與大模型支撐能力升級,目前最明顯的是Agent的核心能力依賴大語言模型(LLM)和視覺語言模型(VLM)的深度集成。依托于海量多模態數據的精細化訓練,這些大模型成功構筑起強大的語義解析與環境交互體系,宛如為Agent奠定了堅實的“認知根基”。其能力進階遵循著一條清晰的軌跡:“模仿學習”起步,歷經“解耦”階段,邁向“泛化”應用,最終實現“涌現”式的突破。具體而言,先是借助強化學習精準勾勒物理世界的運行圖譜,繼而逐步拓展至跨任務領域的廣泛適應,直至在錯綜復雜的場景中自主催生出高效的決策機制。
如今,Agent已衍生出多樣化的類型,諸如能夠跨越不同領域進行交互的通用型Agent、專注于物理環境操作執行的具象化Agent,以及擅長動態內容創作的生成式Agent等,它們廣泛滲透至醫療健康、智能機器人、電子游戲等諸多行業領域。以醫療為例,診斷類Agent能有效輔助分診流程,然而仍需攻克“幻覺”這一技術難題;而在游戲世界中,Agent不僅能優化非玩家角色(NPC)的行為邏輯,還能自動生成栩栩如生的開放世界景觀,極大地豐富了游戲體驗。
四、大模型時代的演進產物:企業級AI Agent 的核心能力與應用場景
大模型的能力持續進化,行業標準化體系的逐步建立完善。2025年將成為AI Agent實現從概念驗證邁向規模落地的重要轉折點,更是其開啟規模化應用征程的關鍵年份。當下,AI Agent正以前所未有的態勢重塑著企業的生產方式與交互模式,這一變革絕非單純的技術層面突破,而是關乎企業戰略全面升級的核心驅動力。
圖4:《2025智能體研究報告》
對于企業而言,在推進AI Agent應用的過程中,應當聚焦于那些高頻發生、規則清晰明確且數據資源豐富的業務場景開展試點工作,通過在實踐中不斷積累寶貴經驗,循序漸進地推動整個業務流程向全鏈條智能化方向轉型升級。
企業級AI Agent的核心能力在于其自主規劃、記憶、工具調用和行動能力。這些能力使其能夠處理復雜的多步驟任務,如智能駕駛、智能家居管理、金融風險預測等。AI Agent的應用場景廣泛,涵蓋金融、醫療、制造、營銷等多個領域。在金融領域,AI Agent能夠實現端到端的自動化流程,提升風險控制和客戶服務效率;在醫療領域,AI Agent能夠輔助醫生進行疾病診斷,提供個性化的治療方案;在制造領域,AI Agent能夠優化生產流程,提升生產效率和產品質量。
即便面臨諸多挑戰,但,得益于大模型技術的快速迭代以及應用場景的持續拓展,Agent依然展現出巨大的發展潛力,有望迎來商業化的重大拐點。隨著A2A、MCP等協議日益普及,不同Agent之間的協作效率將得到顯著提升;而多模態技術領域取得的關鍵突破,例如圖像與語言生成技術的融合、機器人導航能力的增強等,將為醫療、工業等多個行業的實際應用注入強大動力。可以預見,未來,Agent或成為企業數字化轉型的核心工具,驅動AI產業鏈從模型層向應用層延伸,重點關注具備數據、場景和平臺能力的企業。
圖5:《2025智能體研究報告》
AI Agent的蓬勃興起,是大模型、充沛的算力供給、活躍的開源生態以及廣泛的產業應用協同共進的成果。其核心技術依托于大型語言模型(LLM),借助模塊化的設計架構與高效的協作框架,得以實現對復雜任務的自動化精準處理。如今,從最初功能單一的對話機器人(處于L1階段),逐步演進為能夠主動發起行動、展現智能決策能力的高級智能體(達到L3水平),且正穩步朝著更為高端的智能應用場景邁進。眾多科技巨頭,諸如OpenAI、Google、AWS等,均積極投身于企業級Agent市場的開拓之中,成功推出了一系列成熟且頗具影響力的產品與技術方案,像OpenAI精心打造的Operator、AWS推出的Bedrock Agent Core平臺等。這些創新成果不僅有力證實了AI Agent在實際場景中的可行性,還極大地促進了其在企業領域的深度滲透與廣泛應用。
然而,就目前而言,對于Agent這一概念尚未形成一個統一且明確的定義。學界與業界在此方面存在著顯著的核心分歧,焦點集中在是否應著重突出“自主規劃能力”。在學術界看來,一個理想的Agent應當具備涵蓋環境感知、任務規劃、記憶學習等多個模塊所構成的完整閉環能力。例如,他們所提出的多模態通用Agent范式,就全面包含了感知、學習、記憶、認知以及執行這五大關鍵模塊。與之相對,業界則更傾向于以結果為導向來界定Agent。以OpenAI為例,他們將Agent定義為“能夠獨立完成既定任務的系統”,著重強調其利用LLM進行工作流管理、靈活調用各類工具以及實時動態糾錯的能力;而Anthropic則進一步細化了概念區分,將Agent與Workflow明確區隔開來,指出前者是由LLM自主進行流程編排,后者則是依據預先設定好的代碼路徑來協調工具的使用。
圖6:《2025智能體研究報告》
在AI Agent的開發與應用進程中,務必緊密貼合企業的真實需求。具體而言,可通過精心搭建知識庫體系、持續優化上下文工程策略以及科學規劃工具集成方案等舉措,打造出高效且穩定的智能體應用場景。對于企業級AI Agent而言,其價值不僅體現在顯著提升工作效率方面,更能依托數據驅動的精準決策支持,助力企業順利完成智能化轉型。伴隨相關技術的日益精進與成熟,AI Agent必將躍升為企業數字化轉型的核心動力引擎,引領企業突破傳統管理模式的桎梏,推動企業從傳統的管理模式向智能化、自動化的方向發展。
五、AI Agent的未來展望與市場格局
圖7:《2025智能體研究報告》
在當下的AI Agent市場中,競爭格局呈現出明顯的兩極態勢。一方面,科技巨頭依托自身在模型研發、算力儲備、數據資源以及生態構建等方面的顯著優勢,積極謀劃打造統一的平臺級解決方案;而另一方面,眾多創業公司與行業專家聚焦于特定的應用場景,借助垂直領域的深度應用開發、交互模式的創新探索以及成本效益的持續優化等策略,努力探尋市場的突破契機。展望未來,AI Agent的發展路徑將著重圍繞多個關鍵維度展開,諸如成本結構的精細化與效率水平的提升、通用型應用與垂直細分領域的有機平衡、交互范式的革新演進、數據資產的積累與競爭壁壘的構筑,以及人才資源的激烈角逐等。
安全性作為AI Agent邁向大規模應用的關鍵議題,備受關注。伴隨其自主決策能力和交互功能的逐步強化,所面臨的安全威脅也愈發復雜多樣,諸如隱私信息的泄露風險、業務流程的人為篡改隱患、記憶數據的惡意投毒攻擊等一系列新型安全挑戰接踵而至。鑒于此,企業在部署和應用AI Agent的過程中,必須在設計初期就融入全方位的安全防護機制,運用身份驗證技術、記憶數據的加固保護手段、控制流程的精準管控措施等,以達成自主性拓展與風險有效管控之間的動態均衡狀態。
從宏觀視角審視,AI Agent技術無疑將為企業的運營效能帶來顛覆性的提升,并孕育出豐富的業務創新機遇。隨著該技術的持續迭代升級以及在不同應用場景中的深度融合,AI Agent具備在更廣泛領域實現重大突破的潛力,進而有力驅動企業乃至整個社會向智能化方向加速邁進。
我們看到大模型從單一工具演變為驅動千行百業轉型升級的核心引擎。作為大模型落地應用的重要載體,AI Agent正在重構人機協作模式,引領AI從“被動響應”邁向“主動服務”,成為產業創新的強勁動力。國內企業將持續深化企業級AI Agent的核心能力,引領業界開啟智能業務的“主動服務”新時代,賦能全產業實現技術革新!
近日,由百林哲主辦,第九屆CSDI中國軟件研發創新科技峰會,于9月12-14日即將在深圳隆重召開。大會以“ 數算+智躍“為主旨,旨在深入展示AI領域最新技術與應用趨勢, 詮釋中國企業,創新先鋒的深度應用,融合業界領先的大模型、智能體技術深入在研發全方位應用領域,攜手百名國內外頂尖技術專家(京東、華為、百度、阿里、騰訊、字節、亞馬遜、中興、小米、360、螞蟻、攜程、順豐、普元……),共同研討以LLM為核心的AI技術深入軟件研發的落地實踐。
總結
AI正在從大模型時代中,從信息處理者升級為任務執行者,預示著復雜任務和系統,將被AI改寫為數字世界的“代理實體”。企業智能體是下一代核心基礎設施,是企業的群體智慧所在,是重塑生產關系的數字勞動力,最終幫助企業實現業務智能化閉環。
內容參考:網絡、大模型時代圖書、智能體發展