要聞

OpenAI推出醫(yī)療開源測試基準(zhǔn)HealthBench；蘋果發(fā)布可在iPhone上運(yùn)行的極速視覺語言模型FastVLM | 全球科技早參

每日經(jīng)濟(jì)新聞 2025-05-13 07:51:38

每經(jīng)記者｜蔡鼎每經(jīng)編輯｜高涵

｜2025年5月13日星期二｜

NO.1 OpenAI推出醫(yī)療開源測試基準(zhǔn)HealthBench

OpenAI推出 HealthBench開源基準(zhǔn)測試，一項(xiàng)旨在更好地衡量AI系統(tǒng)在醫(yī)療健康領(lǐng)域能力的全新基準(zhǔn)測試。HealthBench由262位在60個國家/地區(qū)執(zhí)業(yè)的醫(yī)生合作打造，包含5000段真實(shí)的健康對話，與以前的狹窄基準(zhǔn)不同，HealthBench通過48562個獨(dú)特的醫(yī)生編寫的評分標(biāo)準(zhǔn)進(jìn)行有意義的開放式評估，涵蓋多個健康背景（例如，緊急情況、全球健康）和行為維度（例如，準(zhǔn)確性、遵循指示、溝通）。

點(diǎn)評：OpenAI推出的HealthBench開源基準(zhǔn)測試，憑借眾多國家醫(yī)生合作打造、大量真實(shí)健康對話以及多維度開放式評估等優(yōu)勢，有望為衡量AI在醫(yī)療健康領(lǐng)域的能力提供更全面、準(zhǔn)確且更具實(shí)踐意義的參考標(biāo)準(zhǔn)，推動AI醫(yī)療技術(shù)的發(fā)展和應(yīng)用。

NO.2 蘋果發(fā)布可在iPhone上運(yùn)行的極速視覺語言模型FastVLM

蘋果日前正式發(fā)布FastVLM，一款專為高分辨率圖像處理優(yōu)化的視覺語言模型（VLM），以其在iPhone等移動設(shè)備上的高效運(yùn)行能力和卓越性能引發(fā)行業(yè)熱議。FastVLM通過創(chuàng)新的FastViTHD視覺編碼器，實(shí)現(xiàn)了高達(dá)85倍的編碼速度提升，為實(shí)時多模態(tài)AI應(yīng)用鋪平了道路。FastVLM的核心在于其全新設(shè)計的FastViTHD混合視覺編碼器，針對高分辨率圖像處理進(jìn)行了深度優(yōu)化。

點(diǎn)評：蘋果發(fā)布的FastVLM憑借其高效的視覺編碼器和卓越的性能，為移動設(shè)備上的實(shí)時多模態(tài)AI應(yīng)用開辟了新天地，展現(xiàn)了蘋果在AI技術(shù)領(lǐng)域的創(chuàng)新實(shí)力。

NO.3 FDA宣布使用AI技術(shù)加速藥品審批流程

美國食品藥品監(jiān)督管理局（FDA）近日宣布，將立即在其所有中心引入人工智能技術(shù)，以縮短藥品審批的時間。此次決定是在 FDA 完成了一項(xiàng)針對科學(xué)審查員的生成性 AI 試點(diǎn)后做出的。FDA 表示，借助這項(xiàng) AI 工具，科學(xué)家們可以減少大量重復(fù)性、單調(diào)的工作，從而提升審核效率。FDA 藥品評估與研究中心（CDER）副主任Jinzhong Liu表示，“這項(xiàng)顛覆性技術(shù)使我能夠在幾分鐘內(nèi)完成曾需三天才能完成的科學(xué)審查任務(wù)。”

點(diǎn)評：這一舉措是在完成針對科學(xué)審查員的生成性AI試點(diǎn)后做出的，AI工具可幫助科學(xué)家減少重復(fù)性工作，顯著提升審核效率，標(biāo)志著AI在醫(yī)療監(jiān)管領(lǐng)域的應(yīng)用邁出了重要一步。

NO.4 特斯拉AI代理上線：幫助客戶更輕松地接觸到公司高層

特斯拉的AI和IT基礎(chǔ)設(shè)施、網(wǎng)絡(luò)安全及車輛服務(wù)負(fù)責(zé)人Raj Jegannathan表示，公司正在推出一款專門用于處理客戶溝通服務(wù)的人工智能代理。這款新的服務(wù)AI代理能夠檢測公司與客戶之間溝通的延遲，監(jiān)測對話的情緒，并自動將某些重要訴求直接上報給管理層。特斯拉正在十個試點(diǎn)地點(diǎn)推出這款A(yù)I代理，其首次投入使用的時間為5月8日。客戶如果在手機(jī)應(yīng)用的消息中心部分輸入“Escalate”一詞，系統(tǒng)將在兩周的延遲后自動將問題上報給高級管理人員。

點(diǎn)評：該代理能檢測溝通延遲、監(jiān)測對話情緒，并自動上報重要訴求，有助于提升客戶服務(wù)質(zhì)量，展現(xiàn)了特斯拉在客戶服務(wù)智能化方面的積極探索。

NO.5 Gemini 2.5 Pro實(shí)現(xiàn)6小時視頻理解

谷歌Gemini 2.5 Pro視頻理解能力再升級，這款旗艦AI模型不僅支持長達(dá)6小時的視頻分析，還擁有高達(dá)200萬Token的超大上下文窗口，同時首次實(shí)現(xiàn)通過API直接解析YouTube鏈接。官方數(shù)據(jù)顯示，該模型在VideoMME基準(zhǔn)測試中達(dá)到84.7%的準(zhǔn)確率，與行業(yè)頂尖水平的85.2%僅有一線之差，彰顯了其強(qiáng)勁實(shí)力。這項(xiàng)突破性技術(shù)現(xiàn)已通過Google AI Studio向開發(fā)者開放體驗(yàn)。Gemini 2.5 Pro的視頻理解突破標(biāo)志著AI正從以語言為中心向以視頻為驅(qū)動的多模態(tài)產(chǎn)品轉(zhuǎn)型。

點(diǎn)評：Gemini 2.5 Pro在視頻理解基準(zhǔn)測試中接近行業(yè)頂尖水平，向開發(fā)者開放體驗(yàn)，標(biāo)志著AI正向以視頻為驅(qū)動的多模態(tài)產(chǎn)品轉(zhuǎn)型，展現(xiàn)了谷歌在AI領(lǐng)域的強(qiáng)大實(shí)力和技術(shù)前瞻性。

免責(zé)聲明：本文內(nèi)容與數(shù)據(jù)僅供參考，不構(gòu)成投資建議，使用前請核實(shí)。據(jù)此操作，風(fēng)險自擔(dān)。

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

Ai 蘋果玻璃 iPhone

上一篇文章

納指漲超4%重返牛市！中概指數(shù)漲超5%

返回每經(jīng)網(wǎng)首頁

下一篇文章

中信建投：建議聚焦外骨骼機(jī)器人、靈巧手、傳感器、機(jī)器狗

相關(guān)文章