米乐m6官网下载:掩盖976%泌尿就医人群 蚂蚁集团开源首个医疗专科推理数据集
发布时间:2024-05-13 09:26:30

  凤凰网科技讯 12月28日,由信通院主办的“虹桥之源”大模型驱动数字化的经济新生态峰会在上海举行。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将提巨大模型在医疗范畴的专业性。

  数据集由练习、验证、测验三部分所组成,包括2132个问答对,每个问答对由医师依据临床经验编写的问题、专家供给的答复以及用于协助推理的上下文构成,病种掩盖了97.6%以上的泌尿科就医人群,能实在复刻治疗场景。数据集能提巨大模型在医疗确诊推理方面的才能,并作为在严厉可控场景下运用的评测基准。

  现在,蚂蚁百灵大模型在中英文的医疗考试以及基准测验到达或超过了GPT4水准,例如,在中文医疗LLM评测榜单promptCBLUE上,获得A榜榜首,B榜第二的成果;在世界医疗问答榜单PubMedQA中,以80.6%的准确率获得了前五的成果,并且是前十中参数量最小的模型,更适合被组织布置和运用。