AI 资源精选
  首页 >大语言模型 >Mengzi3-8B
访问数:153
Mengzi3-8B

厂家:澜舟科技

简介:

Mengzi3-8B 适用于多种自然语言处理任务,主要包括:
文本生成:能够轻松产出高质量、多样化的中文文本内容,涵盖写作,摘要,问答,翻译,阅读理解等多种文本生成场景;
对话系统:为用户提供高效、智能的交互体验,让对话更加流畅自然;
代码生成:协助开发者提升编码效率,激发创新灵感。
核心优势:
低显存高推理,具备更高效能

  详细介绍 - Mengzi3-8B

Mengzi3 8B/13B模型基于Llama架构,语料精选自网页、百科、社交、媒体、新闻,以及高质量的开源数据集。通过在万亿tokens上进行多语言语料的继续训练,模型的中文能力突出并且兼顾多语言能力。

核心优势:低显存高推理,具备更高效能

Mengzi3-8B 是一款高效、低显存需求的 AI 大模型,半精度下显存占用小于 16G,适用于 PC(如 MacBook)和大部分消费级显卡(如 RTX 4090、RTX 4080、RTX 4070Ti)。此外,Mengzi3-8B 的原生推理速度在同级别模型中处于领先地位,特别适合个人开发者和 AI 爱好者使用,真正实现了高效、低成本的 AI 体验。

性能图.png

模型开源地址:

https://hf-mirror.com/Langboat/Mengzi3-8B-Base

https://www.modelscope.cn/models/langboat/Mengzi3-8B-Base/summary


--文 by AixTong.com--
相关资讯 / AI资源