Notable国际 · 科技苹果发布多模态模型Manzano研究人工智能推理海外新闻消费电子+21月15日据Appleinsider报道,苹果发表研究论文介绍多模态模型“Manzano”,通过混合视觉分词器同时产生连续与离散视觉表示,并以大语言模型预测图像语义、扩散解码器进行像素级渲染,从而统一“看图理解”与“文本生成图像”,减少画质与理解力的取舍,并可扩展到深度估计、风格迁移、图像修复等任务。测试中在反直觉指令上的逻辑一致性与GPT-4o等模型接近;研究覆盖3亿至300亿参数版本,显示可随规模提升。该成果仍处研究阶段,或为未来Image Playground等功能奠定底层能力。-