2023-07-13 14:12:30
當地時間7月12日,Google和DeepMind的科研人員在《自然》雜志上發表一項研究,提出了MultiMed QA評估基準,用于評測大語言模型在臨床知識方面的表現。結果研究人員發現,大語言模型構建的AI醫生在很多方面與人類醫生相當。
谷歌的研究人員表示,這項技術不會威脅到全科醫生的工作,但未來可能可以用于醫療求助熱線。
研究人員提出一個評估基準來評測大語言模型在臨床知識方面的表現,在引入指令提示調整后,由此產生的模型Med-PaLM表現令人鼓舞:92.6%的長篇答案符合科學共識,與臨床醫生生成的答案(92.9%)相當;5.9%的答案被評為可能導致有害結果,與臨床醫生生成的答案(5.7%)的結果相似。(澎湃新聞)
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP