AI 资源精选

首页 >大语言模型 >Octopus v2

访问数：1183

Octopus v2

简介：

- 🔥20亿参数的 Octopus v2模型一夜下载量超过2k，受到开发者社区极大关注。
- 📱 Octopus v2在智能手机、汽车、个人电脑等端侧运行，超越 GPT-4的准确性和延迟表现。
- ⚡ Octopus v2比 Llama7B + RAG 方案快36倍，标志着设备端 AI 智能体时代的到来。

详细介绍 - Octopus v2

Octopus-V2-2B是一个拥有20亿个参数的高级开源语言模型，代表了Nexa AI在应用大型语言模型（LLM）进行函数调用方面的研究突破，专门为Android API量身定制。与检索增强生成（RAG）方法不同，后者需要对潜在的函数参数进行详细描述，有时需要多达数万个输入令牌。Octopus-V2-2B为其训练和推理阶段引入了一种独特的函数令牌策略。这种方法不仅使其能够达到与GPT-4相当的性能水平，而且显著提高了其推理速度，超过了基于RAG的方法，使其对边缘计算设备特别有利。

📱 设备上的应用程序：Octopus-V2-2B设计用于在Android设备上无缝操作，将其实用性扩展到从Android系统管理到多个设备的协调等广泛的应用程序。

🚀 推理速度：当进行基准测试时，Octopus-V2-2B表现出非凡的推理速度，在单个A100 GPU上比“Llama7B+RAG解决方案”的组合高出36X。此外，与依赖于A100/H100 GPU集群的GPT-4-turbo（GPT-4-0125-preview）相比，Octopus-V2-2B的速度快168%。这种效率归功于我们的功能性代币设计。

🐙 准确度：Octopus-V2-2B不仅速度快，而且准确度高，在函数调用准确度上超过“Llama7B+RAG解决方案”31%。它实现了与GPT-4和RAG+GPT-3.5相当的函数调用精度，在基准数据集中的得分在98%到100%之间。

💪 函数调用功能：Octopus-V2-2B能够在各种复杂场景中生成单独、嵌套和并行的函数调用。

论文:https://arxiv.org/abs/2404.01744

--文 by AixTong.com--