<noframes id="5guqg"><noframes id="5guqg"><delect id="5guqg"><rt id="5guqg"></rt></delect><rt id="5guqg"></rt><rt id="5guqg"><delect id="5guqg"><delect id="5guqg"></delect></delect></rt><noframes id="5guqg"><rt id="5guqg"></rt><noframes id="5guqg"><rt id="5guqg"></rt><noframes id="5guqg"><rt id="5guqg"><delect id="5guqg"></delect></rt><noframes id="5guqg"><rt id="5guqg"><delect id="5guqg"></delect></rt><noframes id="5guqg"><rt id="5guqg"></rt><rt id="5guqg"></rt><noframes id="5guqg"><rt id="5guqg"></rt> <rt id="5guqg"><delect id="5guqg"></delect></rt><noframes id="5guqg"><noframes id="5guqg"><noframes id="5guqg"><noframes id="5guqg"><noframes id="5guqg"><rt id="5guqg"></rt><rt id="5guqg"><rt id="5guqg"></rt></rt><noframes id="5guqg"><noframes id="5guqg"><rt id="5guqg"></rt> <noframes id="5guqg"><rt id="5guqg"></rt><rt id="5guqg"><rt id="5guqg"></rt></rt><noframes id="5guqg"><rt id="5guqg"><rt id="5guqg"></rt></rt><bdo id="5guqg"></bdo><bdo id="5guqg"></bdo><delect id="5guqg"></delect><rt id="5guqg"></rt><bdo id="5guqg"><delect id="5guqg"></delect></bdo><delect id="5guqg"></delect><rt id="5guqg"><noframes id="5guqg">
  1. 創業頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

大模型冷思考:企業“可控”價值創造空間還有多少?

 2023-11-01 17:34  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

文 | 智能相對論

作者 | 葉遠風

毫無疑問,大模型熱潮正一浪高過一浪。

在發展進程上,從最開始的技術比拼到現在已開始全面強調商業價值變現,百度、科大訊飛等廠商都喊出類似“不能落地的大模型沒有意義”等口號。

在模型類型上,除了百度文心大模型、訊飛星火認知大模型、阿里通義千問大模型等通用大模型,醫藥研發、金融等垂直大模型正積極涌現。幾個月前,新華三集團在業內首提“私域大模型”概念,并發布融合了行業屬性及地域屬性的私域大模型——“百業靈犀”LinSeer,為行業增添了企業落地大模型的創新類型。

而在更直接的數字上,截止到2023年10月初,國內僅公開的大模型數量已達238個,百模大戰正在升級千模大戰。

……接近一年的熱潮后大模型沒有冷卻的跡象,行業普遍的共識形成,這不是風口,而是技術革命。

然而,歷史一次次證明,賽道越是熱鬧,參賽者越需要冷靜的思考。

種種跡象顯示,雖然看起來百花齊放,但事實上AI三大要素(算力、數據、算法),以及大模型發展的行業規則中,當下以及未來很多因素已經既定,一頭熱扎進去的企業們,更應該尋找的是那些不由既成的客觀因素所限制、能夠進行自我價值發揮的地方,才能盡可能獲得相對競爭優勢。

算力“積木化”,可控價值創造集中到“調度”環節

算力常常被視為大模型發展的瓶頸問題,但是,如果從是否“可控”的視角看,在業務層面企業能自己做出決定從而影響算力獲取的地方,其實越來越少。

IT時代Windows+Intel構建起WinTel體,演變為移動互聯網時代安卓+ARM(以高通為代表),到了大模型時代,又進一步演化為AI大模型+GPU——在當前,Nvidia已經成為大模型趨同的算力來源。

2021的Ampere(對應A100等)、2022年的Hopper(對應H100等)、2023的Ada架構……性價比高不高,要看Nvidia架構發展有多快。

算力不再是瓶頸,或者說,其“總體基本面”的提升并沒有什么操作空間——要多少算力就需要多少資本投入,反過來有多少資本投入基本也能買來多少算力。

當算力“口子”被外部技術、內部預算等限定,通過調度提升既有資源利用效率,就成為企業“可控”的價值創造過程。特別是私域大模型,對于企業來說,AI大模型的大小需要平衡算力和能耗的開支,應選擇適合行業特點和業務特點的大模型進行私域部署。

此時,如何榨取硬件資源提供的每一滴能力,加速模型的訓練速度成為首要考慮的問題,而這方面術業有專攻,往往依賴基礎設施服務廠商——針對算力等底層基礎設施提供支撐成為考驗各個服務廠商最基本的能力,其中尤以算力調度能力是其重點。

算力調度往往需要多維能力協同,所以,作為業內首倡私域大模型的新華三給出了自己的回答:依托通過傲飛算力平臺實現算力調度的“最優解”,讓算力可以最大化的按需調度。另一方面以綠洲平臺實現大模型所需的數據支撐,同時在分布式訓練等需求下以智能無損網絡支持AI集群訓練,配備高性能存儲帶來更好的底層存儲支撐,甚至還建設有液冷數據中心來維持算力輸出的穩定性,以此構成一套完整的智算解決方案。

而新華三算力調度的“主腦”傲飛算力平臺則具備異構計算資源統一管理、多元算力資源智能調度的能力,提供包含智能標注、智能訓練、智能調優、智能部署、智能推理的全流程算力智能調度能力。

按官方數據,該平臺能夠將算力利用率提高至70%以上。同時,還支持8000節點的算力調度,并發訓練時間縮短至50%,且斷點自動接續無感知訓練更穩定,在既有GPU資源下能全方面提升大模型訓練性能。

說白了,就是通過一系列算力流程環節的銜接優化(尤其是面對并行計算與分布式計算需求),在充分保障訓練與應用需求的同時降低GPU的空閑時間,讓巨大成本獲取來的算力資源工作盡可能飽和。

總體而言,這一整套高性能算力集群及調度讓客戶能夠實現算力、存力、運力協同感知,實現算力資源充分供給、靈活部署、異構算力最優調度——雖然有多少算力資源很難控制,但用好這些資源企業卻能夠做到完全可控。

當然,除了提升算力利用效率,行業中一些做法還在試圖通過其他方式直接降低模型訓練對GPU資源的要求,例如數據存儲層面進行算子優化等,未來或也存在較大的價值開發空間。

數據“斷面化”,以數據質量建設帶來“護城河”成為企業的必然選擇

目前,企業能夠獲得的數據量來源主要包括公開的數據集與自身沉淀。

在當下時間斷面,這兩種都只能被動等待或由時間積累,數據“量”其實很難有突破,優勢有就是有,沒有就是沒有,并不可控。

當然,也有一些企業試圖主動出擊,例如國外公司Inflection AI以大規模提問的方式來主動提升數據沉淀速度,但這顯然這并不會是主流。

“量”上不可控,則可控的價值創造空間必須更聚焦于“質”上。

中信智庫《人工智能十大發展趨勢》認為,“未來一個模型的好壞,80%由數據質量決定。”

從長遠視角看,大模型的競爭并不是要比誰跑得更快,而是比誰走得更遠,這就需要大模型真實的應用效果,也就需要通過各種方式提升數據質量,來鍛造大模型發展的“內功”。

在數據的計劃、獲取、存儲、共享、維護、應用等環節,都需要針對性的數據管理、治理,最終提升數據質量。這是一個系統性工程,也為市面上的基礎設施服務商們帶來了機會。

例如新華三的綠洲平臺就以場景需求為導向,打造了一個圍繞數據采集、存儲、管理和應用的全棧數據平臺。

通過內置AI算法,綠洲平臺大大提升了數據標記能力,讓數據治理、數據開發等過去很繁雜的流程工作變得極為簡單,而知識圖譜構建能力則幫助數據躍升為知識,從而能夠更好地被業務場景所使用。

事實上,數據深加工帶來高質量數據訓練一直是前沿大模型的核心競爭力所在,OpenAI一貫公開其訓練過程及算法,但對數據如何處理緘口不言。

回過頭來看,數據的“要素化”與“資產化”正在讓百行百業再次審視數據的價值,在數據越來越作為一種新型生產力要素的時代,大模型的本質可以視作一種挖掘數據要素價值的工具,而工具不決定價值,只決定效率。

大模型終將走入底層成為一種普遍的后端能力,技術本身越來越無法成為護城河,而數據則代表了企業在前端與客戶/用戶的連接程度,數據要素的價值釋放將成為企業真正的“護城河”。

所有的數據類平臺提升數據質量的過程,就是在幫助企業進一步挖掘數據要素價值、沉淀數據資產,真正打造企業的“護城河”。

算法“收斂化”,殊途同歸下企業需聚焦訓練效率提升

算法是大模型的能力核心,但長期來看,算法能力卻終將“收斂”。

目前的大模型算法基本上都基于Transformer架構,該架構解決了過去RNN架構難以并行化等核心缺陷,是基因“優勝劣汰”的結果,BERT、GPT、T5、GLM等都其“衍生品”。

所以,算法生來都幾乎有著相同的“基因”。

而在開發框架層面,伴隨著開源生態建設,國外的TensorFlow、Pytorch,國內的MindSpore等幾個主流框架逐步成為共同的選擇。

這意味著,算法的后天的“成長環境”也逐步趨同。

先天+后天,算法創新當下看起來百花齊放,但在未來其價值創新的空間將逐步收窄,企業能夠通過努力獲得的相對優勢將越來越少。

甚至,在Llama 2掀起的開源浪潮下,算法創新的價值被進一步壓縮。

因此,從長期來看,企業最“可控”的價值創造將側重到訓練效率而非算法創新上——同樣的能力與潛力,PK更快速地訓練迭代。

很多廠商提供的開發工具鏈都在直接推進訓練效率,而一些原本旨在提供算力服務的平臺也實現了等價的功能。

例如,傲飛算力平臺支持斷點自動接續無感知訓練,其原本目的在于降低參數迭代期間的GPU資源等待、提升資源利用效率,但客觀上也直接帶來訓練效率的提升,讓算法加速迭代,先把潛力跑出來。

畢竟,加速算法訓練,就是在提升算力資源利用效率。

行業規則“沉淀化”:長期主義仍需回歸到正確的價值觀

大模型熱潮中,人人都會不自覺追求技術與商業價值“上限”,但大模型“下限”問題也日益突出,例如數據隱私、數據安全、知識產權、技術濫用等。

從企業的視角看,行業規則建立迫在眉睫,但其形成過程同樣存在著不由企業決定的“客觀因素”。

關于行業發展的一些法律法規,監管部門在逐步沉淀,例如國家網信辦聯合多部門公布的《生成式人工智能服務管理暫行辦法》,企業要做的是等待并盡力配合與落實。

關于行業統一共識,也需要一個個沉淀,例如,目前已經有從業者提議行業協作開發統一、可信的框架,在隱私保護、模型效用和訓練效率之間取得平衡,企業要做的是積極響應、積極參與。

但在一些規則上,企業能夠、也必須充分發揮“可控”的價值創造能力。

例如,大模型數據安全“容錯率低”,企業必須加大投入。

很多基礎設施廠商都提供了相關的服務,例如新華三的私域大模型百業靈犀以內置安全限制提示詞和出入內容過濾攔截對所有場景下大模型生成內容進行安全性限制,針對所有出入流量和內容進行安全審計和敏感信息攔截。

當然,最直觀反應大模型倫理、體現“下限”的是場景應用的選擇問題。

科研、制造、醫藥、法律……大模型已經走向諸多能帶來社會正向價值的場景。但是,諸如偽造視頻進行詐騙等“場景應用”也已經出現,基于強力的大模型技術有著更強的欺騙性。

技術是刀,大模型是一把更鋒利的刀,它的作用和價值由使用的人決定。

說到底,企業需要構建正確的價值觀,將大模型能力導向數字經濟的正向價值上,才能守住“下限”、實現大模型的長期健康發展。

結語

大模型賽道上,企業必須在“可控”的價值創造空間上發力,才能不斷在各個維度獲得更多相對競爭優勢與發展可能性。

企業也必須以此為標準選擇基礎設施服務、大模型服務的廠商,尤其是在多個維度都能滿足需要的廠商。

可以說,大模型給了這個時代全新的增量價值方向,只有幫助企業實現對“可控”價值創造的把握,才能讓企業在這個全新方向更有著力點。

*本文圖片均來源于網絡

#智能相對論 Focusing on智能新產業新服務,這是智能的服務NO.245 深度解讀

此內容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

•AI產業新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬個為什么》

•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

相關標簽
大模型

相關文章

  • AI智駕時代降臨,端到端奏響“三重奏”

    “追上未來,抓住它的本質,把未來轉變為現在”,俄國哲學家車爾尼雪夫斯曾這樣描述未來。而走到今天的新能源汽車,其通向未來的本質就是做好智能化。吶喊智能化的口號,從2023年延續到2024年。如今,智能化的落點,從最開始的智能座艙、NOA智能駕駛等,開始轉向新的軌跡。近日,小鵬在廣州舉辦“小鵬汽車AI智

    標簽:
    智能駕駛
  • 誰該成為大模型成長的“養料”?

    在科技進步的歷史征程里,我們享受技術成果之前,似乎總要付出一些“隱形”成本。

    標簽:
    大模型
  • 人工智能的“過彎點”,三駕馬車已經全面調整了姿態

    千億級大模型涌現,在CPU通用服務器成功運行

    標簽:
    人工智能
  • Smartbi AIChat即將發布,BI進入超級應用時代

    2024年,GenAI正站在產業化的前夕。在不久前的2024世界人工智能大會(WAIC2024)上,AI巨頭們對行業發展形成了共識:從“卷”模型轉向“卷”應用生態。因此,國產大模型普遍降價,隨之而來的是調用量的大幅增長。這反映出在沒有大模型使用成本的顧慮后,企業對大模型應用的海量真實需求涌現。IDC

  • 未來三年,特斯拉自動駕駛火拼國內新能源智駕?

    文/三電“在時間面前,一切技術障礙都是紙老虎”。十年前,新能源汽車還是一個新概念,十年后的今天,新能源汽車已經滿街跑。再過十年會怎么樣,真的非常值得期待。而在新能源汽車的發展歷程中,2024年上半年注定將留下濃墨重彩的一筆。據中國汽車工業協會最新發布的數據顯示,截止到今年6月底,國產新能源汽車累計產

    標簽:
    特斯拉
  • 超預期的業績增長未能“沸騰”股價,谷歌的AI戰事升級?

    近日,谷歌母公司Alphabet在美股盤后公布了第二季度財報,其中,總營收847億美元,同比增長14%,高于分析師普遍預期的842億美元

    標簽:
    ai智能
  • 現階段的AI落地,只是一場大模型廠商的“賣家秀”?

    商業化愿景下,AI應用元年已經到來。2024年以來,諸多已布局AI大模型技術的科技公司都開始加速推出AI應用產品。比如,今年7月16日,騰訊旗下大模型應用“騰訊元寶”推出“3D角色夢工廠”玩法,成為首個擁有打印級3D生成能力的通用大模型App。無獨有偶,百度也推出了一款名為“文小言”的AI數字人社交

    標簽:
    ai智能
  • 掉隊的百度,突然用AI應用重新殺回?

    文|智能相對論作者|葉遠風松弛感,是這屆奧運會開幕式給很多人留下的直觀感受。而讓用戶觀看奧運的過程也獲得松弛感,同樣是各路APP在奧運季努力的方向。從各種大型賽事報道來看,一般來說,APP們往往致力于整合信息、形成專題頁面,方便用戶一站式瀏覽,從容選擇、查看。但“智能相對論”觀察到,一些嘗試推動用戶

    標簽:
    ai智能
  • AIO是什么意思?人工智能AIO優化與SEO有什么關系?

    AIO是什么?AIO原意是指集成在一起的意思,但這里的AIO,不是AllInOne,是AI+O結合在一起的。AI,懂的人知道,不是愛,是ArtificialIntelligence(人工智能)的簡稱。而O,是英文Optimization(優化)的首字母。所以這里的AIO是指人工智能優化的意思。AIO

  • 阿里云支撐!云計算首次超越衛星成為奧運轉播主要方式

    北京時間7月27日凌晨,巴黎奧運會即將開幕。今年,云上轉播將正式超越衛星轉播,成為奧運賽事走向全球數十億觀眾的主要轉播方式。巴黎奧運會預計11000小時的賽事直播畫面,將通過阿里云向全球分發。這將是1964年奧運會開始衛星電視轉播以來,又一次重大技術進步。據介紹,OBSLiveCloud將成為202

編輯推薦