每日經濟新聞 2025-05-13 07:51:38
每經記者|蔡鼎 每經編輯|高涵
|2025年5月13日 星期二|
NO.1 OpenAI推出醫療開源測試基準HealthBench
OpenAI推出 HealthBench開源基準測試,一項旨在更好地衡量AI系統在醫療健康領域能力的全新基準測試。HealthBench由262位在60個國家/地區執業的醫生合作打造,包含5000段真實的健康對話,與以前的狹窄基準不同,HealthBench通過48562個獨特的醫生編寫的評分標準進行有意義的開放式評估,涵蓋多個健康背景(例如,緊急情況、全球健康)和行為維度(例如,準確性、遵循指示、溝通)。
點評:OpenAI推出的HealthBench開源基準測試,憑借眾多國家醫生合作打造、大量真實健康對話以及多維度開放式評估等優勢,有望為衡量AI在醫療健康領域的能力提供更全面、準確且更具實踐意義的參考標準,推動AI醫療技術的發展和應用。
NO.2 蘋果發布可在iPhone上運行的極速視覺語言模型FastVLM
蘋果日前正式發布FastVLM,一款專為高分辨率圖像處理優化的視覺語言模型(VLM),以其在iPhone等移動設備上的高效運行能力和卓越性能引發行業熱議。FastVLM通過創新的FastViTHD視覺編碼器,實現了高達85倍的編碼速度提升,為實時多模態AI應用鋪平了道路。FastVLM的核心在于其全新設計的FastViTHD混合視覺編碼器,針對高分辨率圖像處理進行了深度優化。
點評:蘋果發布的FastVLM憑借其高效的視覺編碼器和卓越的性能,為移動設備上的實時多模態AI應用開辟了新天地,展現了蘋果在AI技術領域的創新實力。
NO.3 FDA宣布使用AI技術加速藥品審批流程
美國食品藥品監督管理局(FDA)近日宣布,將立即在其所有中心引入人工智能技術,以縮短藥品審批的時間。此次決定是在 FDA 完成了一項針對科學審查員的生成性 AI 試點后做出的。FDA 表示,借助這項 AI 工具,科學家們可以減少大量重復性、單調的工作,從而提升審核效率。FDA 藥品評估與研究中心(CDER)副主任Jinzhong Liu表示,“這項顛覆性技術使我能夠在幾分鐘內完成曾需三天才能完成的科學審查任務。”
點評:這一舉措是在完成針對科學審查員的生成性AI試點后做出的,AI工具可幫助科學家減少重復性工作,顯著提升審核效率,標志著AI在醫療監管領域的應用邁出了重要一步。
NO.4 特斯拉AI代理上線:幫助客戶更輕松地接觸到公司高層
特斯拉的AI和IT基礎設施、網絡安全及車輛服務負責人Raj Jegannathan表示,公司正在推出一款專門用于處理客戶溝通服務的人工智能代理。這款新的服務AI代理能夠檢測公司與客戶之間溝通的延遲,監測對話的情緒,并自動將某些重要訴求直接上報給管理層。特斯拉正在十個試點地點推出這款AI代理,其首次投入使用的時間為5月8日。客戶如果在手機應用的消息中心部分輸入“Escalate”一詞,系統將在兩周的延遲后自動將問題上報給高級管理人員。
點評:該代理能檢測溝通延遲、監測對話情緒,并自動上報重要訴求,有助于提升客戶服務質量,展現了特斯拉在客戶服務智能化方面的積極探索。
NO.5 Gemini 2.5 Pro實現6小時視頻理解
谷歌Gemini 2.5 Pro視頻理解能力再升級,這款旗艦AI模型不僅支持長達6小時的視頻分析,還擁有高達200萬Token的超大上下文窗口,同時首次實現通過API直接解析YouTube鏈接。官方數據顯示,該模型在VideoMME基準測試中達到84.7%的準確率,與行業頂尖水平的85.2%僅有一線之差,彰顯了其強勁實力。這項突破性技術現已通過Google AI Studio向開發者開放體驗。Gemini 2.5 Pro的視頻理解突破標志著AI正從以語言為中心向以視頻為驅動的多模態產品轉型。
點評:Gemini 2.5 Pro在視頻理解基準測試中接近行業頂尖水平,向開發者開放體驗,標志著AI正向以視頻為驅動的多模態產品轉型,展現了谷歌在AI領域的強大實力和技術前瞻性。
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP