每日經濟新聞 2023-10-27 14:43:49
◎騰訊機器學習平臺算法負責人康戰輝表示,目前騰訊研發大模型有兩個方向:在通用大模型上,相比于成本投入而言,騰訊更重視效果,強調長期投入;在小型模型上,希望能更加精細化,將不同的模型應用到不同場景,同時更加考慮投入和產出的性價比和效益。
◎在能力提升方面,混元大模型一大亮點是開放“文生圖”功能。“文生圖”能夠實現輸入對圖片的描述文字后,AI(人工智能)平臺根據文字描述生成對應的圖片,是AIGC(生成式人工智能)具有廣泛應用前景的場景之一,也是全球大模型競速下的“主戰場”之一。
每經記者|王帆 每經編輯|魏官紅
10月26日,《每日經濟新聞》記者從騰訊方面獲悉,騰訊混元大模型迎來全新升級,升級后的騰訊混元中文能力整體超過GPT3.5,代碼能力大幅提升20%。此外,騰訊宣布正式對外開放混元大模型“文生圖”功能。
本次升級距離騰訊正式發布混元大模型不到兩個月。據騰訊透露,目前超過180個騰訊內部業務已接入騰訊混元,已有來自零售、教育、金融、醫療、傳媒、交通、政務等多個行業的客戶通過騰訊云調用騰訊混元大模型API。
對于混元大模型前期訓練成本投入的問題,騰訊機器學習平臺算法負責人康戰輝在接受采訪時表示,混元作為千億級參數規模的大模型,目前訓練成本較高。對于適用于復雜場景的通用大模型,相比于成本投入而言,騰訊更重視效果;而一些細化場景可以使用小模型,更強調成本投入的高性價比。
9月7日,在2023騰訊全球數字生態大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。如今,騰訊公布了最新進展。
在內部應用上,超過180個騰訊內部業務已接入騰訊混元,包括騰訊會議、騰訊文檔、企業微信、騰訊廣告和微信搜一搜等。最近,QQ瀏覽器還基于騰訊混元推出了“PDF閱讀助手”,具備智能摘要、智能問答和多輪提問等功能。記者注意到,實際上,騰訊混元通過自家應用,也間接面向外部C端用戶。
外部用戶方面,已有來自零售、教育、金融、醫療、傳媒、交通、政務等多個行業的客戶,通過騰訊云調用騰訊混元大模型API,應用領域涉及智能問答、內容創作、數據分析、代碼助手等多個場景。今年9月首批通過備案后,騰訊混元大模型也已經面向C端用戶陸續開放體驗,用戶通過小程序或網頁端,就能與騰訊混元對話。
在能力提升方面,一大亮點是開放混元大模型“文生圖”功能。“文生圖”能夠實現輸入對圖片的描述文字后,AI(人工智能)平臺根據文字描述生成對應的圖片,是AIGC(生成式人工智能)具有廣泛應用前景的場景之一,也是全球大模型競速下的“主戰場”之一。
10月26日,騰訊混元大模型“文生圖”技術負責人蘆清林在接受包括每日經濟新聞在內的媒體采訪時表示,大模型“文生圖”的難點體現在對提示詞的語義理解、生成內容的合理性以及生成圖片的效果。針對這三個技術難點,騰訊進行了專項的技術研究,提出了一系列原創算法來保證生成圖片的可用性和畫質。目前騰訊混元“文生圖”能力,已經被用于素材創作、商品合成、游戲出圖等多項業務中。
此外,騰訊也升級了混元的代碼、數學能力。記者了解到,混元大模型經過對32種主流語言代碼文件、各類計算機書籍和博客的學習增訓,代碼處理水平提升超過20%,騰訊內部目前已經有多個開發平臺接入了騰訊混元大模型,工程師們可以使用騰訊混元來進行代碼生成、代碼補全、代碼漏洞檢測和修復、表格數據處理、數據庫查詢等工作。
混元大模型擁有超千億參數規模,預訓練語料超2萬億tokens,相比于同行十億、百億級別的參數規模,研發與訓練成本較高。
談到大模型的研發成本,騰訊機器學習平臺算法負責人康戰輝在接受媒體群訪時表示,目前騰訊研發大模型有兩個方向:在通用大模型上,相比于成本投入而言,騰訊更重視效果,強調長期投入;在小型模型上,希望能更加精細化,將不同的模型應用到不同場景,同時更加考慮投入和產出的性價比和效益。通俗來說,就是“大模大做,小模小做”。
出于上述邏輯,騰訊超180個內部業務接入混元大模型的參數量規模也有所差別。“模型的選擇關鍵還要看場景,要結合業務場景給出靈活的方案,例如現在騰訊的業務部門有的用千億模型,有的用中小模型,有的用混合模型,我們不斷根據業務流量和商業模式去調整出我們自己的技術底座。”康戰輝說道。
《每日經濟新聞》記者注意到,就在本月,多個廠商陸續發布大模型商業應用:百度發布文心一言大模型4.0版本,并推出十余款AI原生應用全面賦能業務生態。在垂直領域,美圖發布了自研AI視覺大模型MiracleVision(奇想智能)3.0版本,通過“提示詞智能聯想”“提示詞精準控制”等功能,可以讓用戶的各種奇思妙想實現所想即所得;宇信科技推出了首批金融行業大模型應用產品和解決方案,包括4個應用級產品和1個開發平臺。
大模型商業化進程正持續推進,騰訊對此也有一些思考。蘆清林以“文生圖”為例,闡述對未來應用路徑的展望。“‘文生圖’的應用價值在廣告場景是非常明確的,第一是能夠幫助廣告主更快地提升投放廣告的效率,第二是騰訊擁有豐富的廣告經驗和知識,知道如何針對廣告主投放廣告的人群,生成更符合人群特點的廣告,因此廣告主愿意在這個產品上投入。”他說道。
據騰訊透露,目前在廣告業務下的多輪測評中,騰訊混元“文生圖”的案例優秀率和廣告主采納率分別達到86%和26%。
封面圖片來源:每經記者 張涵 攝
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP