您现在的位置是:资讯 >>正文

Llama3-V: 全新开源视觉大语言模型出世

资讯17623人已围观

简介近日,AI界掀起了一股新风潮,一款名为Llama3-V的全新开源视觉大语言模型横空出世!据悉,这款模型基于Llama38B和siglip-so400m,被称为最先进的视觉大语言模型之一。与此同时,该模 ...

Llama3-V: 全新开源视觉大语言模型出世

近日,全新AI界掀起了一股新风潮,开源一款名为Llama3-V的视觉世全新开源视觉大语言模型横空出世!据悉,这款模型基于Llama38B和siglip-so400m,大语被称为最先进的言模视觉大语言模型之一。与此同时,型出该模型还具备快速本地推理的全新特点,让用户能够更加便捷地进行推理操作。开源

有关Llama3-V的视觉世一些关键特点包括:优于LLaVA约10-20%的性能表现、训练成本低于500美元以及可与GPT4-V、大语Gemini Ultra和Claude3相媲美的言模性能。同时,型出该模型的全新权重、训练和推理代码也将会开源发布,开源让更多的视觉世开发者能够参与其中。

现在,Llama3-V已经在Hugging Face平台和Github上发布,吸引了大量关注和好评。据悉,这款模型不仅能够优于以往的同类产品,还能够以更小的模型体积达到与其他大型模型相媲美的性能水平。

总的来说,Llama3-V的推出无疑将为AI领域带来一股新的风向,让我们拭目以待,看这款模型能为人工智能领域带来怎样的突破与创新!

HF Model:https://huggingface.co/mustafaaljadery/llama3v…

Github Repo:https://github.com/mustafaaljadery/llama3v

Tags:

相关文章