Back to Feed
总结
红杉中国旗下评测平台xbench与UniPat AI团队联合多家大模型公司及高校研究员,近日对外发布新的多模态理解评测集“BabyVision”。该评测集面向视觉-语言等多模态模型的理解与推理能力评估,意在提供相对统一的测试样本与对比口径,便于开发者与研究者横向比较不同模型表现、跟踪版本迭代效果,并据此识别模型在感知、语义对齐与跨模态推理等环节的短板,为后续模型训练、评测方法改进及产业与学术协同提供参考。
正文
红杉中国 xbench 携手 UniPat AI 团队,联合多家大模型公司与高校研究员,发布新的多模态理解评测集 BabyVision。
发布时间: