Site logo
港股報價由天滙財經提供

國聯民生證券:Token需求在“通脹” 短期觀察大模型廠商提價與需求帶來的邊際改善

時間2026-02-22 20:59:02

智譜

MINIMAX-WP

下載霸財智贏APP,買賣點即市預警,炒家心水交流 >>

智通財經APP獲悉,國聯民生證券發佈研報稱,雲計算逐步變爲“賣資源”,而大模型廠商化身“賣Token燃料+賣成果”。智譜(02513)GLM Coding Plan的漲價折射的是產業定價邏輯的改變:當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價與訂閱化產品轉化爲毛利與現金流。短期觀察提價與需求(Token“通脹”)帶來的邊際改善,中期跟蹤企業席位與訂閱留存帶來的續費與擴張,長期看好治理工具普及帶來的“AI防火牆”新增市場。

國聯民生證券主要觀點如下:

事件:2月12日,智譜在官方渠道宣佈上調GLM Coding Plan訂閱價格,漲幅“至少30%”。 此前,海外雲廠商於本月紛紛提價,如Google Cloud在北美漲價幅度達100%,在歐洲與亞洲也同步上調;同時AWS的價格也上調了約15%。綜合來看,Token需求“通脹”不僅利好雲端算力,也讓模型廠商擁有了議價權。

顛覆傳統互聯網的免費路徑

傳統互聯網軟件的典型路徑是先用免費換用戶規模,憑藉“用戶數和時長”換議價權,然後在廣告、會員訂閱、增值服務、交易抽傭裏變現,免費背後的底層原因無非是邊際成本極低。即多一個用戶或多一次點擊,成本卻可以被帶寬與存儲規模效應稀釋,從而達到近似爲零的邊際成本。

雲計算時代也出現過類似的“先免費/低價再擴張”,但云的計費單位很快變成 CPU/存儲/帶寬/請求數,客戶也習慣了“按量計費”。雲能收費,是因爲它交付的是明確的資源和SLA(服務提供商與客戶簽訂的服務等級協議)。但當行業依舊處在“模型價格戰”時,智譜卻出現了漲價的信號,這意味着大模型時代的“計量單位”從流量(DAU/時長)轉向Token(推理消耗),而Token的消耗在越來越多場景裏是剛需。

大模型時代的變化:Token變成“可計量的生產資料”,不再是“免費流量”

大模型把“對話/寫代碼/生成內容”這類看似是由軟件供應商提供的服務,變成了強依賴算力的在線推理服務。對模型廠商而言,每一次回答都要實打實地消耗GPU、顯存、帶寬與電力;對用戶來說,每一次“讓模型多想一會兒、寫一段更長的代碼、跑一個更復雜的任務”都對應更多Token的消耗,於是Token天然成爲新的計量單位。智譜此前正因爲用戶增長導致算力階段性緊張,對Coding Plan做過“限量發售”安排,這與其後續漲價形成了一個非常典型的“供需鏈條”:需求在短期內大幅增長→資源呈現剛性約束(導致限流/限量)→漲價。

當高峯期擁堵與資源緊張出現時,漲價是一種讓模型廠篩選需求的機制,比“無差別限流”更能保護用戶的體驗。並且,模型廠商的成本端仍與GPU供給、利用率、推理優化強相關,漲價/更合理的分層定價能把模型廠商從“規模越大虧得越多”的陷阱里拉出來,有利於提升毛利與現金流質量。

Token需求在“通脹”

“Token通脹”,不是指Token本身變貴,而是指單位時間內、單位用戶的Token消耗結構性上升。Token需求的高漲有以下幾個原因:

從“問答”變爲“幹活”:模型發展至今,用戶不再滿足於簡單的回答形式,而是開始讓模型重構代碼、改寫文件、生成文檔和跑測試等等。編程場景的特徵天然是“長上下文、多輪迭代、大量輸出”,這對Token是大量的消耗。通過智譜的表述,也證實了開發者依靠其模型用於編碼支持,導致Token消耗的快速增長。

從“單輪”到“Agent的多輪”:智譜把GLM-5定位爲面向Coding與Agent場景的新一代模型;2月12日,MiniMax-WP(00100)也把正式上線的最新旗艦編程模型M2.5標註爲全球首個爲Agent場景原生設計的生產級模型。將M2.5的編程與智能體性能(Coding&Agentic)直接對標Claude Opus4.6。Agent會主動規劃、檢索、執行、反思,多次調用模型,Token消耗自然按步驟累加。

推理強度上升:更多“深度思考、更長鏈路推理”會顯著提高輸出與中間過程的Token消耗。對開發者而言,這往往帶來更高成功率與更少返工,用戶反而願意“多燒Token換效率”。

這意味着Token不是傳統互聯網時代邊際成本幾乎爲零的“流量”,而是生產任務時必不可少的“燃料”。

投資建議

雲計算逐步變爲“賣資源”,而大模型廠商化身“賣Token燃料+賣成果”。智譜GLM Coding Plan的漲價折射的是產業定價邏輯的改變:當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價與訂閱化產品轉化爲毛利與現金流。建議後續持續關注:

雲廠商與算力基礎設施:AI拉動的IT支出與基礎設施投入仍處上行週期,雲側將受益於GPU算力、存儲與網絡I/O等“伴隨型消耗”的持續增長。

大模型廠商:當它們能在編程、Agent、企業流程等高ROI場景中維持訂閱留存與企業席位擴張,能把“Token用量”穩定轉成“省人省時省返工”的交付價值時,就具備了穿越開源與價格戰的能力。

安全治理與運行時的防護工具:隨着企業把AI嵌入工作流,數據泄露、代理越權等風險將推動“AI安全平臺/治理平臺”成爲剛需層。

短期觀察提價與需求(Token“通脹”)帶來的邊際改善,中期跟蹤企業席位與訂閱留存帶來的續費與擴張,長期看好治理工具普及帶來的“AI防火牆”新增市場。

風險提示

技術路線變革具有不確定性;行業競爭加劇。

免責聲明:本資訊不構成建議或操作邀約,市場有風險,投資需謹慎!