访问数:304
Meditron
简介:
Meditron是一个基于Llama的大型医学语言模型,由Meta公司更新并发布。Meditron项目是完全开源的,包括数据、模型权重和配置,这意味着全球的研究人员和开发者都可以自由地访问、使用、修改和改进这一技术。
详细介绍 - Meditron
用途
Meditron-70B 正在作为 AI 助手进行进一步测试和评估,以增强临床决策并普及医疗用 LLM 的访问权。潜在用例可能包括但不限于:
医学考试问题回答
支持鉴别诊断
疾病信息(症状、原因、治疗)查询
一般健康信息查询
可以使用此模型生成文本,这对于实验和了解其功能非常有用。不应直接将其用于生产或可能影响人们的工作。
我们不建议在生产环境中使用此模型进行自然语言生成,无论是否进行微调。
下游使用
Meditron-70B 和 Meditron-7B 都是未经微调或指令调整的基础模型。它们可以为特定的下游任务和应用进行微调、指令调整或 RLHF 调整。我们使用了两种方式来将此模型应用于下游问答任务。
我们在提示中添加了 k 个演示(在我们的论文中为 3 或 5)以进行上下文学习。
我们使用特定的训练集对模型进行下游问答任务的微调。
我们鼓励并期待基础模型适用于更多多样化的应用。
如果您想要一种更互动的方式来提示模型,我们推荐使用具有支持聊天和文本生成 UI 的高吞吐量和内存高效推理引擎。
您可以查看我们下面的部署指南,我们在其中使用了带有 vLLM 的 FastChat。我们通过交互式 UI 平台 BetterChatGPT 收集了我们的定性分析所用的生成内容。
以下是我们用作示例的提示格式:
--文 by AixTong.com--