您现在的位置是:深度 >>正文
智源开源检索排序模型 BGE Re-Ranker v2.0
深度82人已围观
简介CSS站长资源(ChinaZ.com) 3月21日 消息:智源研究院推出了新一代检索排序模型 BGE Re-Ranker v2.0,支持100+ 种语言,文本长度更长,并在多项评测中达到了 SOTAs ...
CSS站长资源(ChinaZ.com) 3月21日 消息:智源研究院推出了新一代检索排序模型 BGE Re-Ranker v2.0,智源支持100+ 种语言,开源文本长度更长,检索并在多项评测中达到了 SOTA(state-of-the-art)的排序结果。该模型是模型智源团队在 BGE(BAAI General Embedding)系列基础上的新尝试,扩展了向量模型的智源 “文本 + 图片” 混合检索能力。
BGE Re-Ranker v2.0采用分层自蒸馏策略优化推理效率,开源通过不同尺寸的检索模型基座(如 MiniCPM-2B、Gemma-2B、排序BGE-M3-0.5B)支持多语言检索能力。模型此外,智源该模型还新增了对 “文本 + 图片” 混合检索功能的开源支持,通过引入 CLIP 模型生成的检索 visual token 实现。
在性能评测方面,排序BGE Re-Ranker v2.0在英文、模型中文、多语言主流基准上取得了优秀的检索效果。例如,在 MTEB、C-MTEB、MIRACL、LLaMA-Index 等评测基准中,BGE Re-Ranker v2.0在重排 BGE-v1.5-large 的 top-100候选集时表现优异,提升了检索精度。同时,模型在 RAG 场景下也能够显著提升各种 embedding 模型的召回结果,配合 BGE-M3可以获得最佳的端到端检索质量。
BGE 系列模型的优秀性能和通用性也受到了社区的广泛关注,Vespa、Milvus 等主流向量数据库框架已经集成了 BGE-M3模型,为用户搭建 “三位一体” 的检索流水线提供了便利。
综上所述,智源研究院推出的 BGE Re-Ranker v2.0检索排序模型具有强大的多语言支持、更长文本长度、优秀的检索效果和灵活的 “文本 + 图片” 混合检索功能,为信息检索领域带来了新的利器。
项目地址:
https://github.com/FlagOpen/FlagEmbedding
https://huggingface.co/BAAI
Tags:
下一篇:淘宝的广告,在朋友圈杀疯了
相关文章
比格PPT体验入口 AI智能PPT设计SaaS平台在线使用入口
深度比格PPT是一款功能强大的在线智能PPT设计SaaS平台,旨在为用户提供快速、高效的演示文稿制作体验。通过语言描述,用户可以轻松生成PPT,从而大幅提升工作效率。平台拥有覆盖商业、教育等多个行业场景的 ...
【深度】
阅读更多游族网络投毒案后续:许垚投毒杀人一审被判死刑
深度CSS站长资源(ChinaZ.com) 3月22日 消息:据上海一中法院消息,2024年3月22日上午10时,上海市第一中级人民法院对被告人许垚涉及的两项重罪——故意杀人罪和投放危险物质罪,进行了公开 ...
【深度】
阅读更多谷歌推出通用AI代理SIMA:3D游戏世界的全能AI玩家
深度划重点:🤖 无需源代码或API,SIMA通过文本和图像提示执行操作🎮 与多个游戏工作室合作,SIMA在多款3D游戏中展现卓越性能🔍 由多种大模型组成的SIMA,模仿人类感知、思考、规划和执行正文:近日 ...
【深度】
阅读更多