效果超出LLaVA&MiniGPT⑷,阿里开源多模态版ChatGPT「mPLUG-Owl」

论文链接:https://arxiv.org/abs/2304.14178 项目链接:https://github.com/X-PLUG/mPLUG-Owl 在线demo:https://modelscope.cn/studios/damo/mPLUG-Owl/summary


提出一种新的模块化的训练多模态大模型的方式 提出测评集OwlEval,以便测试多模态模型在视觉相关任务上的能力 开源模型代码,demo代码和模型权重文件,方便研究者进行进一步的研究。
01
chatgpt中文版 http://chatgpt.guige.xyz
mPLUG-Owl

模型架构

训练策略

在预训练和指令微调阶段冻结视觉模块和语言模块,调剂有限的参数,如MiniGPT4。 冻结视觉模块,训练语言模块,如Kosmos⑴。 在指令微调阶段冻结视觉模块,训练语言模块,如LLaVA。
02
实验
定量分析


消融实验













桂}哥}网}络www.gUIgege.cn
本文来源于chatgptplus账号购买平台,转载请注明出处:https://chatgpt.guigege.cn/jiaocheng/29697.html 咨询请加VX:muhuanidc