米乐m6官网下载:卫宁健康医疗领域大模型WiNGPT 从研发到落地的实践探索
发布时间:2024-05-13 12:20:41

  10月28日,第九届中国健康信息处理大会(CHIP 2023)在杭州举办,会议聚焦“大模型与智慧医疗健康”,探讨了人工智能服务于大健康的关键技术和应用,特别是医疗大模型相关的前沿进展。

  卫宁健康300253)AI实验室负责人陈旭博士在会议上做了题为《医疗领域中的大语言模型-从研发到落地的实践探索》的主题分享。

  陈旭认为,大语言模型发展的数年中,2022年ChatGPT的出现可以说迎来了AI的新突破,或将推进时代的变革。医疗行业的场景是很丰富的,无论面向患者、临床还是管理,都有必要进行全场景的适配探索。基于如此样庞大的革新需求,技术的驱动以及政策的加持一同推动了医疗大语言模型的加快速度进行发展,医疗领域迎来了新的时代,AI技术将持续推动医疗质量、效率和动力的变革。

  在考量现代医疗领域的加快速度进行发展时,我们大家可以观察到几个持续存在的核心问题,这样一些问题包括:医疗人才的供给不足、医疗保障基金的财政压力、患者对于医疗服务的深度依赖及其无法替代性需求,以及医疗行业内部对于政策和法规的影响力集中,可能会引起市场之间的竞争和服务创新受限。尽管要根本性解决这样一些问题并非单一技术所能,但在面对这些挑战时,通用AI可能是缓解这样一些问题的强推动力。

  要实现真正的通用AI还需要具备以下这些条件:大模型、可处理多模态信息、可以联结外部系统的工具/代理、是具身化和自动化的机器人、能够持续地学习优化。我们始终相信,在补全通用AI最后的几块“拼图”后,将会明显提升医疗行业的效率和响应能力,缓解现有的压力点。

  近年间,随着AI技术的发展,很多大语言模型如雨后春笋般出现在人们视野中,竞争非常激烈之下,是高昂的投入成本。卫宁健康想做的并不是参与AI技术界的“百模大战”,而是想要做一个可以真正落地的,能持久提供服务并不断迭代、能够解决真实医疗问题的产品,为医疗行业带来实际的价值。

  卫宁健康于10月18日的Winning World 2023上发布了卫宁健康医疗领域大模型WiNGPT,是面向医疗垂直领域的大模型,基于通用大模型的技术,结合高质量医疗数据,针对医疗场景优化和定制,为医疗行业各个场景提供智能知识服务。WiNGPT具备三个特征:

  一是“小而专”,是大模型上的“小模型”。WiNGPT根据医疗场景和高质量训练数据,精确满足各种业务需要,具有较高的准确率和较低的误诊可能性;

  二是低成本交付。通过优化模型算法,基于CPU部署,经测目前生成效率已接近GPU;

  三是支持可定制的私有化部署。私有化部署保护医疗数据不出医院,避免数据泄露的同时,提供更高的系统稳定性和可靠性。并能为客户定制化提供不同预算的“套餐”,满足多种医疗机构的需求。

  从2023年初开始研发到正式的发布,WiNGPT经过了基于公开数据和医疗领域数据的大量训练,预训练数据达到20G+,微调数据更是达到50万+。在训练过程中,不仅更好地完善了产品,我们还认识到了数据质量的重要性,并总结了一整套 “数据工程”方案,包括:

  低质量数据过滤:通过人工审核和大模型主动学习等多种技术方法,筛除低质量数据。

  数据去重:集成“哈希”、“embedding”等算法,去除相似数据,保证数据的唯一性。

  经过以上步骤的重重“选拔”,我们把更优质、更精准的数据给到大模型,让其能更加高效、高质地进行数据训练。

  同时,在摸索和实践中,我们还构建了自己的WiNGPT医疗大模型测评体系,对大模型的能力进行评测。

  客观题部分,包括17个科目分类,总共有13060选择题。我们会根据标准答案判断模型答案是不是正确,并据此统计准确率。

  主观题部分,按照医疗系统主要场景进行分类,包括电子病历、护理病历、体检系统、知识助手、临床科研、公卫医技和医务管理。在此基础上,每一类系统又进一步分成了内容生成、文书质控、风险评估、知识问答/推理等多个二级分类,最终测评的场景涵盖了30种。主观评测方法上采用人工打分与GPT4的结合方式,评分标准包括回答的准确性、相关性、一致性、完整性和权威性,我们会参照标准答案,对模型生成的答案进行详细的评分。

  在专科/专项能力方面,采用类似临床实验一样的测评方式,采取“case by case”的办法来进行深入评估,这样的评估体系确保了模型在医疗领域的有效性与安全性。

  通过内部测评得分我们大家可以看到,WiNGPT2-13B的客观题成绩领先于一众公开的模型,主观题平均分位居第二,仅与排在第一位的GPT3.5相差0.01分。

  随后,陈旭还分享了更多测试示例,在多个医疗场景的测试中,WiNGPT的能力与GPT-4不相上下:

  在分享的尾声,陈旭基于WiNGPT的研发与落地经验进行了总结:要有自己的生成式AI技术;要自研与合作并行;应用场景仍要一直大胆地探索;投入规模要在可控范围;局限性与风险控制要重视;可以从临床专家的想法入手,有效性验证不可或缺;医疗大语言模型未来商业化重在落地。当具备以上因素,AI技术才能够焕发真正的光彩,做出有价值、有意义的大语言模型。

  在医疗领域,好的AI技术或将加速改变 们的生活小习惯、分化和重塑 产关系、改善医患关系、改变医院和HIT企业的关系,未来的医疗行业不单单是一个提供基本医疗服务的领域,随技术的深入融合和消费的人对个性化服务的需求增加,它更是一个技术行业和消费的人行业,但在这种愿景下,需要行业内更多伙伴的共同努力来实现。作为医疗垂直领域大模型,WiNGPT以成为“医护的智能助手”为目标,在落地与实践中持续地迭代和更新,在未来,卫宁健康也会探索更多的医疗应用场景,以好技术、好产品,助力医疗机构的高质量发展。

  中国健康信息处理大会(CHIP)是中国中文信息处理学会(CIPS)医疗健康与生物信息处理专业委员会开展的“以信息处理技术助力探索生命之奥秘、提高健康之质量、提升医疗之水平”为主旨的年度会议。CHIP是中国健康信息处理领域的重要会议,是世界各地学术界、企业界和政府部门研究人员、从业人员分享创意,推广研究成果和经验的平台。

  又见上市券商迎新总裁!系有十年从业经验的券业老人,公司利润大增逾150%

  利好接力!全球资管巨头:正在买入A股!中概股集体飙升,数十家A股公司出手,什么情况

  又见上市券商迎新总裁!系有十年从业经验的券业老人,公司利润大增逾150%

  欧菲光:2023年第三季度净利5432万元,上年同期净亏损24.07亿元

  隆基绿能:2023年第三季度净利润25.15亿元,同比下降44.05%

  破1亿!鸿蒙4成史上升级最快鸿蒙版本,余承东:已经有98款华为产品可升级

  已有325家主力机构披露2023-06-30报告期持股数据,持仓量总计5.90亿股,占流通A股31.92%

  近期的平均成本为7.48元。空头行情中,目前正处于反弹阶段,投资的人可适当关注。已发现中线买入信号。该股资金方面受到市场关注,多方势头较强。该公司运营状况良好,多数机构觉得该股长期投资价值较高。

  股东人数变化:三季报显示,公司股东人数比上期(2023-09-20)减少320户,幅度-0.37%

  投资者关系关于同花顺软件下载法律声明运营许可联系我们友情链接招聘英才使用者真实的体验计划

  不良信息举报电话举报邮箱:增值电信业务经营许可证:B2-20090237