落地與否成檢驗大模型能力的唯一標準。外界之前普遍認為騰訊在大模型上的動作慢了,但實際上騰訊一直踩在自己的節(jié)奏里。
文|徐鑫
【資料圖】
編|周路平
經(jīng)歷三個月的行業(yè)落地應(yīng)用探索后,騰訊云行業(yè)大模型迎來了三大升級。
底層能力層面,騰訊一方面公布了自研大語言模型混元的新進展,另一方面宣布MaaS 平臺全面接入 20 多個主流開源模型。這意味著,騰訊云正基于業(yè)界的需求和動向,及時做出了自己的反應(yīng)。
平臺能力層面,針對過去大半年國內(nèi)產(chǎn)業(yè)客戶在大模型 ToB 落地摸索中,遭遇成本高、門檻高等普遍難題,騰訊云繼續(xù)升級大模型訓(xùn)練、精調(diào)工具鏈,覆蓋大模型開發(fā)全生命周期,進一步幫助企業(yè)降低大模型應(yīng)用落地門檻。
在應(yīng)用層,騰訊云更新升級了包括騰訊企點分析 · AI 助手在內(nèi)的10 款智能應(yīng)用和解決方案,展示了這些產(chǎn)品在用戶體驗提升和效率升級上的價值。
當下,業(yè)界有觀點認為大模型在行業(yè)化落地缺乏亮眼的應(yīng)用,價值有待進一步彰顯。
騰訊云此次能力升級延續(xù)了實用路線,繼續(xù)從產(chǎn)業(yè)需求和當下的應(yīng)用實踐出發(fā),著眼于解決行業(yè)內(nèi)在大模型訓(xùn)練或應(yīng)用場景中遇到的現(xiàn)實問題。
01
市場需求催生三大升級
企業(yè)里的 " 表哥 "" 表姐 " 應(yīng)該都嘗過這種痛,明明只想簡單了解 " 最近業(yè)務(wù)的銷售情況 ",卻要花費大量精力和時間。對指標、拉數(shù)據(jù),鏈路長,流程復(fù)雜,可能還需要拜托隔壁的專業(yè)數(shù)據(jù)分析團隊,才能得到結(jié)果。
如果有一個智能分析助手,只需在對話框輸入想了解的信息,馬上就能調(diào)取數(shù)據(jù)、分析,提取結(jié)論,并且一鍵生成報告,顯然能大幅提升工作效率。
大模型時代,這樣的智能小助手離普通用戶并不遙遠。9 月 7 日,騰訊全球數(shù)字生態(tài)大會上,騰訊云宣布,基于行業(yè)大模型技術(shù),更新升級近 10 款智能應(yīng)用和解決方案,加快大模型在產(chǎn)業(yè)落地。上述的騰訊企點分析 AI 助手就是升級的其中一個應(yīng)用,目前已向大客戶開放內(nèi)測申請。
它的智能能力來自分析大模型的加持,融入了專業(yè)的數(shù)據(jù)分析知識、不同行業(yè)的分析指標體系,可依據(jù)行業(yè)特點進行意圖理解、思路拆解、數(shù)據(jù)推理并生成結(jié)論,大大降低了數(shù)據(jù)獲取和分析門檻。這是騰訊云行業(yè)大模型改變軟件應(yīng)用,切實帶來效能革命的典型案例。
目前,騰訊云行業(yè)大模型在金融、零售、文旅、政務(wù)等各個領(lǐng)域已初步應(yīng)用,應(yīng)用場景涵蓋了對話類客服、營銷內(nèi)容生成、跨模態(tài)檢索、風控等企業(yè)核心的生產(chǎn)經(jīng)營環(huán)節(jié)。
除了智能應(yīng)用升級,本次大會上,騰訊云沿襲產(chǎn)業(yè)應(yīng)用為先的思路,還從技術(shù)底座、平臺能力維度升級 MaaS 能力。
湯道生最近接受采訪時提到 ," 很多人知道大模型是個風口,很想抓住這個千載難逢的機會,但實際上用大模型來解決什么問題,以多大成本來獲得什么價值、多少價值,其實還沒想得很清楚。"
大模型 ToB 如火如荼,當下正從狂飆期向理性應(yīng)用轉(zhuǎn)變。許多企業(yè)在思考大模型能解決什么問題,需要耗費多大的成本,獲得怎樣的價值等問題。此次騰訊云 MaaS 的三大升級,實際是從不同層面回應(yīng)這些問題。
技術(shù)底座上,騰訊正式公布了自研通用大模型混元大模型,并宣布全面支持 20 多個行業(yè)最新的主流開源模型。
騰訊混元大模型的參數(shù)規(guī)模超千億,預(yù)訓(xùn)練語料超 2 萬億 Tokens,具備強大中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及任務(wù)執(zhí)行能力。目前,騰訊內(nèi)部的 50 多個產(chǎn)品和業(yè)務(wù)已接入,未來行業(yè)客戶可直接通過 API 調(diào)用,也可將騰訊混元大模型作為基底模型,構(gòu)建專屬大模型應(yīng)用。
平臺能力上,升級后的 TI 平臺工具鏈性能更強,騰訊云 HCC 高性能計算節(jié)點、星脈高性能計算網(wǎng)絡(luò)等覆蓋大模型開發(fā)、應(yīng)用全生命周期,客戶只需加入自己獨有的場景數(shù)據(jù),即可短時間內(nèi)精調(diào)出專屬的模型方案。
外界觀察,底層模型能力升級,解決了用戶對不同場景里大模型的需求和靈活配置的問題。而平臺能力升級,則進一步降低用戶使用大模型的門檻。
至于一系列智能應(yīng)用發(fā)布,則回應(yīng)了用大模型獲得什么價值的問題。過去幾個月里,行業(yè)客戶經(jīng)歷了挖掘、尋找和適配的過程。一位電力行業(yè)的資深人士告訴數(shù)智前線,大模型 ToB 目前場景不少,但缺乏比較亮眼的應(yīng)用。但在業(yè)內(nèi)看來,行業(yè)落地本就不是一件性感的事,大模型對原有場景的智能化提升效果明顯。
騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲在接受采訪時提到,做應(yīng)用層才能帶來直觀的反饋。比如在文旅行業(yè)場景里,要注入的數(shù)據(jù)和要理解的東西就不太一樣,大模型要具備的能力也不太一樣,有些需要有推理能力,有些需要有通用能力。做了應(yīng)用層后,打穿從客戶反饋到模型提升的鏈路,能針對性解決模型效能的一些問題。
騰訊云智能負責人吳運聲
總體來看,騰訊云 MaaS 的三大升級是圍繞大模型如何落地,更好滿足客戶需求的應(yīng)時之舉。
02
行業(yè)落地考驗技術(shù)儲備
過去半年,大模型 ToB 的落地應(yīng)用摸索已經(jīng)度過嘗鮮期。
騰訊云副總裁、騰訊企點研發(fā)負責人吳永堅介紹,在跟一些金融行業(yè)投顧領(lǐng)域的客戶接觸過程中,他們發(fā)現(xiàn),客戶的認知從原來的" 覺得大模型什么都能做 "的階段,已經(jīng)收斂到" 大模型能夠給自身業(yè)務(wù)帶來什么價值上了"。
產(chǎn)業(yè)界對模型落地的態(tài)度也在逐漸回歸理性。模型廠商們察覺到,大模型的應(yīng)用還在初期,企業(yè)在模型選擇、模型可靠性、應(yīng)用成本、使用門檻等層面,存在各種考量和顧慮。
一位電力行業(yè)資深服務(wù)商告訴數(shù)智前線,當下企業(yè)基于這些開源或閉源的模型來做行業(yè)化落地,還遠沒有到開箱即用的程度,會遇到不少困難,比如訓(xùn)練行業(yè)模型時高質(zhì)量的數(shù)據(jù)來源問題,以及如何在提示詞工程環(huán)節(jié)給出高質(zhì)量反饋等。
騰訊云也服務(wù)了不少行業(yè)客戶,他們基于自身的實踐,拆解了整個模型訓(xùn)練鏈條后發(fā)現(xiàn),從需求判斷到模型選擇,到最終幫助客戶行業(yè)化訓(xùn)練落地,整個過程涉及非常復(fù)雜的流程和機制,也需要強大的底層技術(shù)支持。
吳運聲用一個教育行業(yè)的案例展示了大模型訓(xùn)練背后的復(fù)雜程度。這位客戶希望通過企業(yè)的既有錄音文件來判斷用戶是否具備某種屬性,從而方便企業(yè)定向運營。它涉及拆解需求、選擇基底模型、試模型、開始訓(xùn)練、中間評測、訓(xùn)練結(jié)束、模型部署和反饋回傳等多個環(huán)節(jié),其中任何一個節(jié)點出問題,都大大影響模型出來的效果。
以基底模型選擇環(huán)節(jié)為例,目前可選的模型很多,要參考因素也不少,比如訓(xùn)練的數(shù)據(jù)量大小,客戶是否自己提供機器,用什么類型的數(shù)據(jù)(格式、中英文等)訓(xùn)練,預(yù)算多少,希望訓(xùn)練時長等多個因素。
有了初步選擇,到要 " 試一試 " 環(huán)節(jié),也很考驗?zāi)P蛷S商的能力。" 試的過程怎么試?部署要求不能很復(fù)雜,要能通過三五個模型,快速驗證出初步的觀點。" 吳運聲介紹。
這一復(fù)雜流程里,騰訊云并非只是簡單從算力層面提供支持。騰訊云 TI 平臺提供了整個模型訓(xùn)練的完整工具鏈,來保障訓(xùn)練任務(wù)高效、穩(wěn)定和順利進行,并能評測和部署調(diào)用。
比如,針對訓(xùn)練時間和成本高的問題,騰訊云升級后的太極 Angel 大模型加速框架,可通過異步調(diào)度優(yōu)化、顯存優(yōu)化、計算優(yōu)化等方式,相比行業(yè)常用方案,性能提升 30% 以上。這些能力來自于過去騰訊在深度學(xué)習領(lǐng)域多年積累。
高速網(wǎng)絡(luò)和向量數(shù)據(jù)庫也為大模型訓(xùn)練提供重要的底層支撐能力。騰訊云此前打造的星脈網(wǎng)絡(luò)是業(yè)內(nèi)網(wǎng)絡(luò)傳輸速度最高的網(wǎng)絡(luò)之一。今年 7 月,騰訊云發(fā)布了 AI 原生向量數(shù)據(jù)庫 Tencent Cloud VectorDB,也是國內(nèi)首個從接入層、計算層、到存儲層提供全生命周期 AI 化的向量數(shù)據(jù)庫,最高支持 10 億級向量檢索規(guī)模,延遲控制在毫秒級。吳永堅認為,這些都是相比其他廠商,騰訊云所具備的差異化關(guān)鍵技術(shù)能力。
模型的評測也是目前業(yè)界關(guān)注到的大模型應(yīng)用的短板點。一位能源行業(yè)人工智能業(yè)務(wù)的高管提到,行業(yè)模型訓(xùn)練時他們發(fā)愁從哪里找高質(zhì)量的問題,來判斷大模型的性能。" 提示工程做不好,可能會非常影響模型的效果。" 另外,業(yè)界人士也發(fā)現(xiàn),大模型訓(xùn)練和落地的鏈條很長,僅評測單點效果,很難評測整體表現(xiàn)。
目前,騰訊云與中國信通院開展了行業(yè)大模型標準體系及能力架構(gòu)的研究,共同發(fā)布了行業(yè)大模型標準體系,參考騰訊云在行業(yè)大模型產(chǎn)業(yè)應(yīng)用領(lǐng)域的實踐和經(jīng)驗,為客戶構(gòu)建行業(yè)大模型提供了標準化流程、綜合評估方法,幫助大模型在產(chǎn)業(yè)更快落地。
03
騰訊云的三步走
在騰訊混元大模型正式亮相之前,外界普遍認為騰訊太慢了。但從騰訊云過去半年多的動作,大體能看到騰訊云發(fā)展大模型的三條路徑。
首先,不難發(fā)現(xiàn),相比于百度、阿里等廠商先發(fā)通用大模型,騰訊云選擇了先從行業(yè)大模型路徑切入。
這與植根于其基因中的產(chǎn)業(yè)視角有關(guān)。技術(shù)并不是單一的割裂存在,而是在技術(shù)研發(fā)階段就會與產(chǎn)業(yè)應(yīng)用平衡。例如,騰訊云的技術(shù)團隊在做識別技術(shù)研究時發(fā)現(xiàn),棧道識別、山火識別的需求很分散。同時山火這類場景里的數(shù)據(jù)掌握不夠,很難識別出來。后來騰訊研究了萬物識別的思路,構(gòu)建一個更大的知識圖譜,通過發(fā)現(xiàn)物體之間的關(guān)系來組成事件。這種抽象方式一方面有很好的學(xué)術(shù)價值,同時也是從之前的解決場景里問題的視角出發(fā),在解決實際問題積累的經(jīng)驗與研究進步之間形成了良性循環(huán)。
產(chǎn)業(yè)落地實效是騰訊云評判大模型價值的唯一指標。吳運聲提到,大模型技術(shù)要能最終產(chǎn)生價值,才是他們最關(guān)注的要素?;谶@一標準,他們最先從行業(yè)大模型起步,把技術(shù)聚焦到行業(yè)。隨著行業(yè)大模型應(yīng)用經(jīng)驗的積累,垂直場景里深入了解用戶的使用方式和需求,還能幫助廠商沉淀出更豐富的解決方案,增加新的產(chǎn)品方向。
其次,從打造大模型應(yīng)用商店到接入開源模型。這也是目前行業(yè)內(nèi)的普遍做法。
湯道生在采訪中提到,市場上大模型的選擇很多,往往有不同側(cè)重的場景,最近各種開源大模型發(fā)展也很快,客戶需要選擇與更新大模型的靈活性。
業(yè)界也認識到,不同類型的任務(wù)及場景對模型的要求不一樣。以常規(guī)的文本摘要任務(wù)為例,十億級和百億級模型在這些任務(wù)上有不錯表現(xiàn)。而一些帶強推理屬性比如雞兔同籠為代表的任務(wù),則需要更大的模型。在這一背景下,單一模型已經(jīng)無法滿足客戶場景的需求。
行業(yè)也在順應(yīng)這一趨勢。最典型的就是微軟,它從最初的投資并提供 OpenAI 閉源大模型服務(wù),轉(zhuǎn)而和 Meta 牽手上線開源的 Llama 2。國內(nèi)包括騰訊云在內(nèi)的云廠商們在上個月也紛紛宣布支持接入開源大模型。
再次,從打造標桿案例到規(guī)模化復(fù)制。隨著大模型底層能力日漸完善,目前大模型廠商們面向企業(yè)的服務(wù)模式也變成了兩類:一類是自己的研發(fā)能力比較足,通過精調(diào)來訓(xùn)練自己的行業(yè)大模型;一類是調(diào)用 API,成本相對更低,能快速使用。
在這兩類服務(wù)方式下,前一類客戶是騰訊云希望作為標桿打造的客戶。例如一些金融投顧類客戶,他們研發(fā)能力強、經(jīng)費足,對新技術(shù)的投入能力和意愿更充分。針對這類客戶,騰訊云會與這些客戶做更多場景合作打磨,最終形成標桿型的行業(yè)樣例。
他們是大模型策略上的第一步。隨著前一類發(fā)展到更成熟階段,騰訊云的能力沉淀到產(chǎn)品層面,就要面向腰部客戶做產(chǎn)品的規(guī)模化復(fù)制。
隨著打法的明晰,騰訊云在行業(yè)場景上的偏好和選擇也已經(jīng)明了。數(shù)前線獲悉,騰訊云目前會綜合考量市場空間、騰訊云自身的產(chǎn)品技術(shù)積累,同時與已有產(chǎn)品的配合程度等多種因素來選擇行業(yè)模型的布局領(lǐng)域。最終,他們希望打造的行業(yè)大模型,一方面能形成一定的準入門檻,另一方面能真正解決客戶的痛點問題。吳運聲介紹,具有端到端能力的產(chǎn)品,未來會是騰訊云重點發(fā)力的方向。
結(jié)語
經(jīng)歷了前段時間的大模型狂飆之后,業(yè)內(nèi)已經(jīng)意識到技術(shù)的應(yīng)用還要面對諸多困難:既有幻覺、成本高、部署難等現(xiàn)實苦惱,也有一些非技術(shù)層面的挑戰(zhàn)需要克服。
而落地與否成了檢驗大模型能力水平的唯一標準。只不過,相比于外界的熱鬧和喧囂,騰訊一直在保持自己的節(jié)奏和做事思路,正在基于客戶的真實需求,專心打磨落地場景。
本文為數(shù)智前線(szqx1991)原創(chuàng)內(nèi)容
進群、轉(zhuǎn)載或商務(wù)合作聯(lián)系后臺
文章精選
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-09
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08
頭條 23-09-08