如果說2023年是大模型的資格賽,融資額度決定了能否晉級,2024年已然快進到了淘汰賽的階段。
字節跳動、阿里云、百度智能云、騰訊云等先后在5月中下旬加入“價格戰”,輕量級模型直接免費,主力模型的API價格普遍下調了90%以上。曾經以“燒錢”著稱的大模型,迅速進入到“白菜價”時代。
當時就有人提出這樣的問題:大廠選擇“燒錢狂飆”,大模型創業公司怎么辦?
時間過去半個多月,幾家獨角獸級的大模型創業者紛紛表明了態度:智譜AI果斷跟進,一個月里兩次下調價格;MiniMax悄然啟動了注冊認證贈送1億tokens,以及TPM擴容不收費的活動;百川智能創始人王小川公開表態不會跟風降價;零一萬物CEO李開復直言“國內大模型市場瘋狂降價是雙輸的打法”。
作為大模型行業真正意義上的“第一戰”,大廠們不計成本的拼價格,到底會對初創企業產生什么樣的影響?
三種可能的結果
截止到目前,大模型降價潮還在蔓延中,市場格局的變化至少需要半年乃至更長時間。但在故事塵埃落定前,并不難揣測一些可能的結局。
第一種比較理想化的結果:大模型降價利好開發者,AI原生應用加速爆發,逐漸從量變引發質變。
目前大多數中小企業和個人開發者是通過API接口來調用大模型能力的,瘋狂降價前的價格普遍在0.02元/千tokens上下,對于缺少盈利模式的開發者來說,算力成本儼然是一座沉重的大山。
大模型降價甚至免費,意味著開發者的成本曲線將大幅下降,促使開發者更低成本進行開發、試錯,進而打造出更多的AI原生應用,讓大模型能力滲透到更多場景中。也許當下的應用仍存在同質化,主要以智能助手和情感陪伴為主,卻不乏從量變引發質變,孕育出超級應用的可能。
可以佐證的是,百度宣布ERNIESpeed和ERNIELite免費開放使用后,兩款模型的日調用量翻了10倍。有點像移動互聯網早期的一幕,因為運營商下調了流量費,用戶開始嘗試各種新奇應用,最終迎來了百花齊放的繁榮景象。而在一個生機勃勃的生態里,每個大模型廠商都將是受益者。
第二種更符合現實的結果:部分缺少“護城河”的大模型廠商被淘汰,算力、人才和資本越來越集中。
一種較為流行的觀點是:誰的用戶多,產生的數據就越豐富,投喂給大模型的“飼料”就越多,越有可能訓練出更好的AI。大模型廠商降價的目的,是為了吸引更多人使用,將用戶的真實使用數據反哺給大模型,然后進行訓練迭代。
資本市場的謹慎態度,讓“百模大戰”的局面曇花一現,但不少拿到了融資的中腰部創業者,仍在煉模型這件事上苦苦掙扎。頭部玩家們打出的價格牌,有望讓部分搖擺的創業者放棄自研大模型,將注意力轉移到應用層或其他領域,避免大模型在底層硬件、軟件等方面的重復建設,推動整個行業朝同一個方向發力。
不管是出于什么樣的考量,行業集中度的提升都不是什么壞消息。大模型屬于極限考驗算力資源和人才密度的賽道,即使“百模大戰”沒有上演,活躍的大模型廠商仍然多達兩位數,還需要進一步優勝劣汰。
第三種相對悲觀的結果:價格戰是同質化的表現,當價格成為市場的主導力量,將上演“圈地運動”。
網約車、外賣、社區團購等移動互聯網時期的經典戰役,無不經歷了價格戰的階段,且或多或少是同質化競爭導致的。倘若大模型卷性能帶來的收益越來越低,而且能力大同小異的時候,價格無疑是攻城略地的有效手段。
可能在一些人眼中,大模型的關鍵在于效果,比起價格,客戶更在意落地帶來的價值。這樣的觀點沒有錯,卻忽略了價格戰的時機:如果企業已經深入使用了一段時間,價格上的差異很難撬走客戶;如果客戶還處于選型的階段,誰能吸引到更多的客戶,誰就在競爭中拿到了先手棋。
借用智源研究院總工程師林詠華的說法:“大模型的降價潮是一場生態的爭奪戰。當一家企業已經適配了一個模型,他未必還愿意再去適配更換另一個,在更換成本客觀存在的前提下,行業企業會希望先通過價格的方式拉攏一批用戶。”沿循這樣的邏輯,大模型的價格戰和網約車、共享單車等并無本質的區別,都是一場有預謀的“圈地運動”,不過是目標對象不同而已。
客觀的說,大模型價格的下降是必然的結果,畢竟推理成本下降了。就像百度創始人李彥宏在 Create 2024 百度 AI 開發者大會上提到的:“相比一年前,文心大模型推理的成本降到了原來的1%。”
問題在于,國內大模型的價格幾乎是斷崖式的,并未給大模型創業者足夠的緩沖時間,尚未找到行之有效的盈利方式。
這場價格戰中最活躍的選手,基本都是云廠商,降價乃至免費獲取到的客戶,可以通過模型微調、模型部署以及各種配套云服務對沖成本。而大模型創業者缺少足夠厚的生態,甚至要向云廠商租賃算力,API的商業模式被“切斷”后,短期內恐怕難以實現“自我造血”。
無論以哪一種結果收場,大模型創業者都是弱勢的一方。
怎么才能活下來
歷史經驗告訴我們,在充滿不確定的賽道里,從來都沒有穩操勝券的戰局。大模型的背后是一場萬億級的資本盛宴,比起場上的幾家云廠商,初創企業的想象空間更大,總有人希望他們可以留在牌桌上。
云廠商推波助瀾的價格戰,無疑會加重大模型初創企業的危機感,但并不意味著沒有破局的可能。
對策一:技術側破局,在大模型性能上搶先打破天花板,或者在大模型的落地部署上找到最優解。
按照獵豹移動董事長傅盛的說法:“短期來看,大模型的性能遇到了瓶頸。誰也甩不開誰,誰也拿不出撒手锏,降低推理成本、降低售價成了現在每一家的高優先級任務”。撥開價格戰迷霧最好的方式,正是在大模型性能上甩開對手。面對不明晰的技術路線,不乏“運氣”的成分,但初創企業往往更有“賭”的勇氣。
即使不能在性能上拉開太大差距,提升大模型工程化能力也是一個可行方向。目前API調用的是“標準版模型”,想要將大模型能力和場景深度融合的企業類用戶,仍需要對大模型進行精調或本地化部署。如果能夠進一步降低大模型的落地門檻和成本,不無對沖“價格戰”沖擊的可能。
這也是一些大模型創業者正在嘗試的應對方案。比如智譜AI在MaaS 2.0大模型開放平臺上推出的一鍵微調功能,用戶僅需準備訓練數據,不需要代碼即可完成一個“私有大模型”的訓練。
對策二:專注提升大模型的差異化能力,做云廠商的“ISV服務商”,低姿態熬過大模型浪潮的淘汰賽。
鑒于隱私、安全、性能等種種因素,行業內一直存在“模型混用”的現象,即在不同場景調用不同的大模型。在各家模型能力水平相近、價格不相上下的情況下,打造某一塊的“比較優勢”,同樣是一種活法。
況且阿里云、百度智能云等云廠商,也在“拉攏”大模型創業者:一方面在算力資源上和大模型廠商綁定,比如阿里云對MiniMax、月之暗面的投資,都將一部分資金限定用于購買阿里云服務;另一方面積極布局一站式大模型開發及服務運行平臺,比如百度智能云千帆大模型平臺,用戶可以同時調用不同大模型的能力。至少就現階段而言,沒有云廠商愿意為了大模型的“芝麻”,丟了云服務的“西瓜”。
就像許多行業曾出現的,價格戰常常是行業進入“大混戰”的標志。對于那些沒有拿到巨額融資的大模型創業者,以ISV服務商的身份“茍活”,熬過大模型浪潮的淘汰賽,何嘗不是一種生存哲學。
對策三:繞過或弱化在To B市場的競爭壓力,選擇To C作為突圍方向,試圖成為下一個時代的行業巨頭。
王小川不摻和“價格戰”的理由是:“在國內的商業環境里,To B的市場比To C小十倍。”百川智能同步發布了AI助手“百小應”,開啟“超級模型+超級應用”雙輪驅動模式,希望能夠和云廠商進行錯位競爭。
有相似想法的不只有王小川。MiniMax先后孵化出了星野、海螺AI等多款日活超過百萬的產品;月之暗面一開始就專注于To C路線,推出了Kimi智能助手;對價格戰詬病連連的李開復,出任零一萬物旗下AI助手“萬知”的“首席體驗官”;就連To B布局最深的智譜AI,也開始加碼推廣AI助手智譜清言。
踏足To C賽道就能避免內卷了嗎?正如前面所提到的,目前To C應用以智能助手和情感陪伴為主,大模型初創企業尚未給出更好的產品形態,同樣集中在陪聊、提效等場景,功能大同小異。不過,相較于To B價格戰的被動性,To C承載了大模型創業者的希望。
創業從來都是九死一生,所有的成功之路都充滿荊棘,沒有人能提前知道哪種對策是正確的選項。
至少就目前而言,情況遠沒有到糟糕的程度。字節跳動放出的降價“大招”,并未影響智譜AI、月之暗面的新一輪融資,且估值均已超過30億美元;布局多模態通用大模型的生數科技,憑借對標OpenAI Sora的視頻大模型Vidu,日前完成了百度領投的數億元Pre-A輪融資......
然而,并非所有的創業者都這么“幸運”。前微軟(亞洲)互聯網工程院副院長簡仁賢創辦的竹間智能,已經在現金流壓力下停工了6個月;憑開源模型Stable Diffusion走紅的Stability AI,傳出了尋求被收購的消息......
突如其來的大模型價格戰,某種程度上為行業敲響了警鐘,在信息差越來越小的語境下,像互聯網時代那樣照搬國外的商業模式,抑或是踩著時間窗口和紅利窗口“一步登天”,已經沒有生存的土壤。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
明知產能嚴重過剩的新能源企業卻還在重金擴產,多半因為他們花的不是自己的錢;明知極度燒錢的AI大模型卻開始打價格戰,多半因為他們并不靠這東西掙錢。所有投資人必備的一項技能,就是中觀行業景氣度及商業模式對比。很明顯,AI有很多的商業邏輯與其他行業非常相似。就比如:有實力的才能卷、免費的往往才是最貴的。打
近日,斯坦福大學AI團隊發布了一個名為Llama3-V的開源模型,被證實套殼抄襲國內清華與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V2.5一事,引起了全網的關注。目前斯坦福團隊成員已經刪除了他們在社交平臺上官宣模型的推文,并將該項目在Github和HuggingFace上的庫一并刪
趕超GPT-4的階段性升級,可以看作是國產大模型有序迭代部署、不斷拉近差距的標志,切莫像手機跑分那樣,在過度營銷的作用下,淪為被群嘲的對象。
“人工智能的商業模式,是要創造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執著于前沿技術的探索,后者則發力應用優化和商業化落地。南轅北轍的兩個方向,或許已經無法直接進行排位先后、優
智能體進化發展了一年,現在的RPAAgent迭代到什么程度了?從實在智能最新發布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現了流程全自動化AIAgent構建到執行全自動化,持續進化RPAAgent再次降低智能體應用門檻實在智能重磅發布實
崔大寶|節點財經創始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯的概念炒不動了,英偉達股價動輒暴跌重挫,引發“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節跳動宣布“以厘計費”,打響國內大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業單位發錄取公告了!壞消息!他們沒錄你,錄了個數字人。圖片來源網絡隨著數字人技術的突破,越來越多的傳統企業和機構開始用上了“數字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數字人給捧上了。數字人捧上了“鐵飯碗”簡單翻看一下全國各地事業單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業引發關注。據悉,近日地平線已通過中國證監會IPO備案,擬發行不超過11.5億股境外上市普通股并在香港聯合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供
8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態。據官方統計數據,今年現場逛展觀眾高達25萬人次,比去年增加25%。機器人行業有多火?看看2024世界機器人大會火爆程度便可知
瞄準場景需求,打造國內領先的自主可控、高質量超大載重高烈度環境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實力榮摘創業大賽一等獎這個比賽5年培育出16家“獨角獸”HICOOL2024全球創業者峰會暨創業大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個國家和地區的7406個創業項
人工智能是新一輪科技革命和產業變革的重要驅動力量。無錫市作為中國的科技創新中心之一,正通過構建人工智能"算力+算法+數據"三要素齊備的產業生態,為產業技術創新應用提供強大支撐,通過“AI+”行動推動人工智能與多個產業交叉融合,實現技術落地和產業化,加速形成新質生產力,打造具有國際競爭力的產業創新智造
近日,2024龍蜥操作系統大會(OpenAnolisConference)在北京圓滿召開,此次大會由中國計算機學會開源發展委員會、中關村科學城委員會、海淀區委網信辦、中國開源軟件推進聯盟指導,龍蜥社區主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進化