AI 资源精选
  首页 >健康 >Meditron
访问数:304
Meditron

厂家:EPFL LLM Team

简介:

Meditron是一个基于Llama的大型医学语言模型,由Meta公司更新并发布。Meditron项目是完全开源的,包括数据、模型权重和配置,这意味着全球的研究人员和开发者都可以自由地访问、使用、修改和改进这一技术。

  详细介绍 - Meditron

用途

Meditron-70B 正在作为 AI 助手进行进一步测试和评估,以增强临床决策并普及医疗用 LLM 的访问权。潜在用例可能包括但不限于:

  • 医学考试问题回答

  • 支持鉴别诊断

  • 疾病信息(症状、原因、治疗)查询

  • 一般健康信息查询

可以使用此模型生成文本,这对于实验和了解其功能非常有用。不应直接将其用于生产或可能影响人们的工作。

我们不建议在生产环境中使用此模型进行自然语言生成,无论是否进行微调。

下游使用

Meditron-70B 和 Meditron-7B 都是未经微调或指令调整的基础模型。它们可以为特定的下游任务和应用进行微调、指令调整或 RLHF 调整。我们使用了两种方式来将此模型应用于下游问答任务。

我们在提示中添加了 k 个演示(在我们的论文中为 3 或 5)以进行上下文学习。

我们使用特定的训练集对模型进行下游问答任务的微调。

我们鼓励并期待基础模型适用于更多多样化的应用。

如果您想要一种更互动的方式来提示模型,我们推荐使用具有支持聊天和文本生成 UI 的高吞吐量和内存高效推理引擎。

您可以查看我们下面的部署指南,我们在其中使用了带有 vLLM 的 FastChat。我们通过交互式 UI 平台 BetterChatGPT 收集了我们的定性分析所用的生成内容。

以下是我们用作示例的提示格式:

prompt_example.png

--文 by AixTong.com--
相关资讯 / AI资源