最新标签话题

Magic NewsRoom - AI-Powered News Aggregation

苹果发布多模态模型Manzano研究

Notable

国际 · 科技

苹果发布多模态模型Manzano研究

人工智能推理

+2

1月15日据Appleinsider报道，苹果发表研究论文介绍多模态模型“Manzano”，通过混合视觉分词器同时产生连续与离散视觉表示，并以大语言模型预测图像语义、扩散解码器进行像素级渲染，从而统一“看图理解”与“文本生成图像”，减少画质与理解力的取舍，并可扩展到深度估计、风格迁移、图像修复等任务。测试中在反直觉指令上的逻辑一致性与GPT-4o等模型接近；研究覆盖3亿至300亿参数版本，显示可随规模提升。该成果仍处研究阶段，或为未来Image Playground等功能奠定底层能力。

No more articles