(資料圖片)
智能聊天機(jī)器人ChatGPT能代替醫(yī)生問診嗎?杭州一名醫(yī)生試著給它出了一套中國執(zhí)業(yè)醫(yī)師“考試卷”,滿分100分,ChatGPT的成績是57分,沒及格。
“十大科目各選了10題,一半是基礎(chǔ)醫(yī)學(xué)知識,基本是書上有的;一半是專業(yè)實(shí)踐題,需要邏輯推理。ChatGPT基礎(chǔ)題、實(shí)踐題的得分差不多,正確率都不到60%。”2月22日,浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院精神衛(wèi)生科醫(yī)生呂海龍告訴澎湃新聞(www.thepaper.cn)。
呂海龍想到做這個實(shí)驗(yàn),是因?yàn)樗诳剖覅⑴c一項人工智能研究,希望未來借助AI監(jiān)測眼球活動等,輔助精神科臨床醫(yī)生診斷。ChatGPT面世后,醫(yī)學(xué)界也有關(guān)于它是否能代替醫(yī)生問診的討論,呂海龍和浙江一家媒體一起做了這項實(shí)驗(yàn)。
“ChatGPT是依據(jù)2021年以前的數(shù)據(jù)訓(xùn)練的,我從2020年臨床執(zhí)業(yè)醫(yī)師資格考試真題庫中選了100道單選題?!彼嬖V澎湃新聞,題目涵蓋十大科目,包括生理學(xué)、醫(yī)學(xué)微生物學(xué)、病理學(xué)、藥理學(xué)、衛(wèi)生法規(guī)、內(nèi)科、外科、婦產(chǎn)科、兒科和心理學(xué)-精神科。
據(jù)介紹,中國執(zhí)業(yè)醫(yī)師考試滿分600分,及格線360分。這次給ChatGPT出的“考卷”滿分100分,將一道道題目發(fā)在對話框內(nèi)進(jìn)行。
按照呂海龍的預(yù)期,ChatGPT對一些可背誦的、書上有的基礎(chǔ)醫(yī)學(xué)知識,答題情況會比較好,一些需要診斷推理的題略遜?!暗珜?shí)測下來,ChatGPT基礎(chǔ)醫(yī)學(xué)知識的答題準(zhǔn)確率是56%,和專業(yè)實(shí)踐題的58%基本持平,很多書上有答案的基礎(chǔ)題,它給了錯誤答案——我們猜,是不是在網(wǎng)站上‘學(xué)習(xí)’了錯誤答案?”呂海龍表示,超出預(yù)期的是,對一些條件充足、邏輯清晰的實(shí)踐題,ChatGPT的準(zhǔn)確率很高。
實(shí)踐題中,ChatGPT的主要失分項是一些信息不全、癥狀不典型的病例判斷。“如患者主訴乏力,醫(yī)生可以大致預(yù)想幾種可能再排除,而ChatGPT不會‘猜’,只能放棄回答。”呂海龍表示。
從學(xué)科看,ChatGPT“偏科”比較嚴(yán)重:內(nèi)科題的準(zhǔn)確率最低,只有20%;醫(yī)學(xué)微生物學(xué)、病理學(xué)、兒科、心理學(xué)-精神科這幾個科目的準(zhǔn)確率達(dá)到70%。
不過,呂海龍仍看好ChatGPT未來在醫(yī)學(xué)領(lǐng)域的應(yīng)用,“完善數(shù)據(jù)庫后,如果ChatGPT能做到對基礎(chǔ)醫(yī)學(xué)類知識100%正確,在患者有科普需求時準(zhǔn)確作出專業(yè)知識回答,或是成為醫(yī)生的助手,也是很有意義的?!?/p>
關(guān)鍵詞: chatgpt 基礎(chǔ)醫(yī)學(xué)
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 hngelin.com All Rights Reserved.
中國網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
冕宁县| 资中县| 宝应县| 临沂市| 崇礼县| 湛江市| 台湾省| 沂水县| 黎平县| 当涂县| 淮南市| 灵璧县| 延寿县| 闵行区| 晋州市| 辽宁省| 台北市| 洛川县| 潮安县| 溧水县| 苗栗县| 兴宁市| 秦皇岛市| 镇雄县| 奉新县| 潞西市| 凤台县| 广汉市| 诸城市| 驻马店市| 米林县| 自治县| 宕昌县| 滦南县| 芮城县| 承德市| 山东| 合水县| 财经| 南和县| 营山县|