AI 资源精选
  首页 >音频相关 >VSP-LLM
访问数:260
VSP-LLM

厂家:未知

简介:

VSP-LLM是一个结合视觉语音处理(Visual Speech Processing)与大型语言模型(LLMs)的框架,旨在通过LLMs的强大能力最大化上下文建模能力。VSP-LLM设计用于执行视觉语音识别和翻译的多任务,通过自监督视觉语音模型将输入视频映射到LLM的输入潜在空间。该框架通过提出一种新颖的去重方法和低秩适配器(LoRA),可以高效地进行训练。

产品特色:
视觉语音识别
视觉语音翻译
自监督学习
去重和低秩适配器训练

  详细介绍 - VSP-LLM
暂无详情。
相关资讯 / AI资源