每日經濟新聞 2025-05-07 12:06:57
5月7日,聯想創新科技大會(Tech World)在上海舉辦。會上,聯想展示了與清華大學及無問芯穹聯合研發的“聯想推理加速引擎”,這是專為高效AI PC推理設計的軟硬件協同優化平臺,可讓普通PC本地推理能力媲美OpenAI的o1-mini云端模型。現場還展示了搭載該引擎的臺式電腦,造價約4萬元,預計下半年上市,可大幅降低企業用戶私有化部署大模型的成本,模型本地訓練成本可下降98%。
每經記者|楊卉 每經編輯|張益銘
今年年初,AI一體機批量現世,讓企業尤其是中小型企業部署AI和大模型的成本從動輒百萬元下探到了20萬元左右。幾個月后,這一成本有望進一步下探至數萬元級別。5月7日,以“讓AI成為創新生產力”為主題的聯想創新科技大會(Tech World)在上海舉辦,《每日經濟新聞》記者現場參會。
會上,聯想集團展示了其在端側算力方面的最新成果——“聯想推理加速引擎”。《每日經濟新聞》記者在發布會現場了解到,這款由聯想、清華大學及無問芯穹聯合研發的推理引擎是專為高效AI PC推理而設計的軟硬件協同優化平臺,可讓一臺普通PC(筆記本電腦)的本地推理能力媲美OpenAI去年發布的o1-mini云端模型。
從實現邏輯上看,“聯想推理加速引擎”主要通過高性能并行解碼、算子融合優化以及異構計算技術,需與大模型推理芯片相結合,從而實現多種應用場景下推理速度的提升,同時降低功耗和內存占用。
聯想集團董事長兼CEO楊元慶在發布會現場稱,消費者將在即將發布的下一代AI PC上體驗到“聯想推理加速引擎”。“今天隨著AI需求的爆發式增長,端側計算和推理能力的提升將依然保持指數級增長的速度,甚至更快。未來12個月,端側AI綜合能力將實現至少三倍的提升,這也許不是夢想!”楊元慶稱。
《每日經濟新聞》記者還在展臺現場發現,聯想集團此次還展示了搭載上述加速引擎的臺式電腦產品。據展臺現場工作人員介紹,該款產品內置了1張中階顯卡、1張顯存擴容卡以及“聯想推理加速引擎”,整體造價約在4萬元左右,可實現32B大模型的本地訓練,預計今年下半年上市,有望進一步降低金融、教育、法律等領域的企業用戶尤其是中小企業用戶私有化部署大模型的成本。
據上述工作人員介紹,市面上的32B大語言模型傳統訓練方案的整體造價很高,如國內某廠商的成本約在200萬元左右,最少需要8張英偉達顯卡,對中小企業來說部署成本過高。在聯想此次展示的電腦上,通過內置的“AI Studio”軟件平臺,用戶可將自己的數據庫及個性化信息通過自選大模型(32B模型)進行訓練,模型本地訓練成本可下降98%。
封面圖片來源:每日經濟新聞 資料圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP