访问数:187
Phi-3-vision
厂家:Microsoft
简介:
Phi-3-Vision-128K-Instruction是一个轻量级、最先进的开放多模态模型,建立在数据集上,包括合成数据和过滤后的公开网站,重点关注文本和视觉上的高质量、推理密集的数据。
该模型属于Phi-3模型家族,多模态版本可以支持128K上下文长度(以令牌为单位)。该模型经过了严格的增强过程,结合了监督微调和直接偏好优化,以确保准确遵守指令和稳健的安全措施。
详细介绍 - Phi-3-vision
Phi-3型号系列中有四种型号;每个模型都是根据微软负责任的人工智能、安全和安保标准进行指令调整和开发的,以确保其可以现成使用。
Phi-3-vision是一个具有语言和视觉功能的4.2B参数多模式模型。
Phi-3-mini是一个3.8B参数的语言模型,有两种上下文长度(128K和4K)。
Phi-3-small是一个7B参数的语言模型,有两种上下文长度(128K和8K)。
Phi-3-mediate是一个14B参数的语言模型,有两种上下文长度(128K和4K)。
你可以在微软的Azure AI Studio 进行试用:Azure AI | 机器学习工作室
Phi-3-vision 的Blog:Phi-3介绍: 重新定义小语言模型
Phi-3-vision 技术报告(论文):[2404.14219] Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone (arxiv.org)
--文 by AixTong.com--