医联：医疗版ChatGPT直播评测，与真人医生几乎一致-太平洋礼仪网

当前位置：首页 > 行业

医联：医疗版ChatGPT直播评测，与真人医生几乎一致

来源：哔哩哔哩发布时间：2023-08-07 13:38:56

(相关资料图)

国内首个医疗大模型，已经在“接诊”患者了。最近，一组AI医生医院真实站岗数据曝光：共接诊120多名患者，从问诊、检查到诊疗方案全流程覆盖；涉及心内科、消化内科、呼吸内科、内分泌科、肾脏内科、骨科、泌尿外科七大疾病科室，患者疾病类别多元，复杂程度不一；医学水平不输国内三甲医院主治医生，与真人医生诊疗方案一致性达到96%；来自北大人民医院、中日友好医院、阜外医院和友谊医院等国内顶尖医院的7位专家教授围观点赞。这样公开化、规模化的AI医生评测，在国内是首次，放眼全球也是第一次见到。更想不到的是，背后的主角MedGPT——基于Transformer的1000亿参数大模型，才刚问世一个月。

目前在实际诊疗中，它已经具备多轮连续对话和多模态能力。而在未来规划中，MedGPT还会上线医疗版的Plugin Store，预计将搭载1000+医疗应用，极大丰富AI医生的诊疗工具，提升诊疗效率。

从上述这些数据与表现来看，96%的一致性，想不到。这样的迭代速度，更想不到。MedGPT直播首秀：接待百名患者这场直播首秀其实是一场实打实的人机医学一致性评测。除了AI医生MedGPT外，还有10位来自四川大学华西医院的主治医师共同参与。为了保证评测的权威性和科学性，一方面由国内顶尖医院的专家教授组成评审团，进行审核和多维度打分。另一方面，整个流程也进行了特别的设计。简单来说，患者进屋问诊，但是是和有医师执业资格的“翻译员”对话。翻译员把患者主诉在电脑上分别传递给真人医生和AI医生，如此多轮往复，最终根据检查结果，给出诊断。就像当初AlphaGo大战围棋界，中间帮助Alpha执行“落子”动作的执棋手，就是这个“翻译员”的角色了。

这样一来AI医生与真人医生之间互不干涉，且条件基本一致，双方就能给出独立的判断。

最终，经过一天的鏖战，真人医生综合得分为分，AI 医生综合得分为分，比分结果上一致性达到了96%。

在评审过程中，专家们也发现了一些意想不到的“惊喜”：

比如，出现漏诊误诊的概率比较小。北大人民医院薛峰主任就发现，MedGPT通过多轮询问，根据患者脚底板疼痛症状，竟然在最后可以推断诊断出「有可能出现压迫颈神经」这样的结果。这也就是说，从知识储备上，AI医生其实可能高于一个经验不太丰富的医生。另外，MedGPT就诊时的“沉稳”表现也得到了点赞。中日友好医院心内科主任医师任景怡就表示：我觉得最好的一点是当诊断尚不明确时，MedGPT并不会轻易给出结论，而是要坚持通过继续问诊或检查收集更多信息。于是即便MedGPT还存在一定问题，她还是给了比真人医生还高的分数，并直言：这是里程碑的结果。

关键词：

今日头条加码创作者激励计划

人民网评：更好发挥督查激励的杠杆效应

前11月浙江省进出口规模超去年全年进口规模首次突破万亿元

北京住房公积金管理中心：贷款审核环节应在3个工作日内完成

易烊千玺：踏实演戏继续带来更多更好的作品

行业

医联：医疗版ChatGPT直播评测，与真人医生几乎一致

医联：医疗版ChatGPT直播评测，与真人医生几乎一致

沪最新106家“安全优质信得过果园”名单来啦！看看都在哪？

2023湖南常德柳叶湖旅游度假区教育系统招聘教师体检公告

中新文娱对话伯远：逆风振翅的蝶，终将飞越沧海

质子“身负”三大未解之谜

梦幻西游：全民PK赛必备阵容大揭秘，谁说只有暴力输出？

vivo V3正式发布 vivo为何执着于自研“影像芯片”？

和田玉墨玉品牌排行榜

2024国家公务员考试申论考试的本质是什么

朱碧芳(对于朱碧芳简单介绍)

季前赛战报：常规时间加的斯1-1莱切，点球3-1...

内蒙古自治区住宅与房地产网官网（内蒙古自治区住宅与房地产网）

中国队3:0横扫日本队，夺成都大运会女排冠军

蛇会在什么时间吃鸽子?

“红树林之城”海鲜美食放送季即将启幕

分手后挽回男友的话简短（分手后挽回男友的话）

中国太保快速应对山东德州5.5级地震

宝马三系和小3哪个好看？外观、内饰与品牌形象全面对比！

【原耽双男主小说推荐】《谪仙与小蛇》作者：谁家小囡txt

钩码是什么(钩码可以用什么代替)

山东德州地震，郑州一市民感到床摇晃，以为“熬夜心跳过速的错觉”

cf空白昵称代码复制百度知道（cf空白名字复制2019）

监理公司丨一周简讯（2023年第32周）

国家防办、应急管理部部署重点地区防汛救灾工作

iPhone不管是电池还是续航能力一直都是用户吐槽的点之一

今日头条加码创作者激励计划

人民网评：更好发挥督查激励的杠杆效应

前11月浙江省进出口规模超去年全年进口规模首次突破万亿元

北京住房公积金管理中心：贷款审核环节应在3个工作日内完成

易烊千玺：踏实演戏继续带来更多更好的作品

医联：医疗版ChatGPT直播评测，与真人医生几乎一致

沪最新106家“安全优质信得过果园”名单来啦！看看都在哪？

2023湖南常德柳叶湖旅游度假区教育系统招聘教师体检公告

中新文娱对话伯远：逆风振翅的蝶，终将飞越沧海

质子“身负”三大未解之谜

医联：医疗版ChatGPT直播评测，与真人医生几乎一致

医联：医疗版ChatGPT直播评测，与真人医生几乎一致

沪最新106家“安全优质信得过果园”名单来啦！看看都在哪？

2023湖南常德柳叶湖旅游度假区教育系统招聘教师体检公告

中新文娱对话伯远：逆风振翅的蝶，终将飞越沧海

质子“身负”三大未解之谜

梦幻西游：全民PK赛必备阵容大揭秘，谁说只有暴力输出？

vivo V3正式发布 vivo为何执着于自研“影像芯片”？

和田玉墨玉品牌排行榜

2024国家公务员考试申论考试的本质是什么

朱碧芳(对于朱碧芳简单介绍)

季前赛战报：常规时间加的斯1-1莱切，点球3-1...

内蒙古自治区住宅与房地产网官网（内蒙古自治区住宅与房地产网）

中国队3:0横扫日本队，夺成都大运会女排冠军

蛇会在什么时间吃鸽子?

“红树林之城”海鲜美食放送季即将启幕

分手后挽回男友的话简短（分手后挽回男友的话）

中国太保快速应对山东德州5.5级地震

宝马三系和小3哪个好看？外观、内饰与品牌形象全面对比！

【原耽双男主小说推荐】《谪仙与小蛇》作者：谁家小囡txt

钩码是什么(钩码可以用什么代替)

山东德州地震，郑州一市民感到床摇晃，以为“熬夜心跳过速的错觉”

cf空白昵称代码复制百度知道（cf空白名字复制2019）

监理公司丨一周简讯（2023年第32周）

国家防办、应急管理部部署重点地区防汛救灾工作

iPhone不管是电池还是续航能力一直都是用户吐槽的点之一

今日头条加码创作者激励计划

人民网评：更好发挥督查激励的杠杆效应

前11月浙江省进出口规模超去年全年 进口规模首次突破万亿元

北京住房公积金管理中心：贷款审核环节应在3个工作日内完成

易烊千玺：踏实演戏 继续带来更多更好的作品

医联：医疗版ChatGPT直播评测，与真人医生几乎一致

沪最新106家“安全优质信得过果园”名单来啦！看看都在哪？

2023湖南常德柳叶湖旅游度假区教育系统招聘教师体检公告

中新文娱对话伯远：逆风振翅的蝶，终将飞越沧海

质子“身负”三大未解之谜

前11月浙江省进出口规模超去年全年进口规模首次突破万亿元

易烊千玺：踏实演戏继续带来更多更好的作品