图像生成技术的新突破:小米大型模型团队提出?

图像生成技术的新突破:小米大型模型团队提出了一种对角线蛇自回归的图像生成方法,该方法主要是以前的自回归方法
图像生成技术的新突破:小米大型模型团队提出了一种对角线蛇自回归的图像生成方法,该方法主要是以前的自回归方法
2025年4月18日17:17
在家
在4月18日的新闻中,大型小米模型仅宣布了对角蛇扫描自回旋图像产生(DAR)中指示的提议,以有效地确保相邻索引的令牌接近星系。与传统的生产方法相比,它可以像蛇一样沿着伊马莱的对角线产生每个像素柔性,这比传统方法更自然,并且更接近人类的绘画直觉。大小米团队模型表示,DAR在Imagenet基准测试O中取得了1.37的得分OF 256×256,这反映了类似技术(SOTA)的最佳结果。小米正式表示将支持更灵活的多分辨率图像。只要该方法与LLM培训和感兴趣的方法高度兼容,小米大型模型团队将继续探索对这一代人对多模式和技术解决方案的更常见的理解。当前,相关的论文,培训代码和模型权重打开。主页有一个官方地址:培训代码:https://github.com/ xiaomi-research/dar模型参数:https://huggingface.co/ wbh123/dar Paper arxiv arxiv地址:https://arxiv.org/ABS/25003.11129