英伟达推出最新的 GauGAN AI 景观生成模型_新闻中心

2021-11-26 17:18 iotworldtoday

关键词：人工智能英伟达科技

导读：英伟达表示，该公司新发布的 GauGAN2 演示是“第一个在单个 GAN 框架内结合多种模式（文本、语义分割、草图和样式）”。

　　英伟达推出了其 GauGAN 模型的更新版本 GauGAN2。

　　GauGAN 是一个 Microsoft Paint 风格的平台，可以让用户创建风景图像，然后模型能够将它们转换为逼真的图像。

　　新的 GauGAN2 可以仅使用文本生成图像。

　　用户可以输入“冬天”、“有雾”或“彩虹”等短语，人工智能模型可以生成与所需描述符匹配的图像。

　　“只需按一下按钮，用户就可以生成分割图，这是一种显示场景中物体位置的高级轮廓，”根据 Nvidia 的公告。

　　“从那里，他们可以切换到绘图，使用天空、树木、岩石和河流等标签通过粗略的草图调整场景，让智能画笔将这些涂鸦融入令人惊叹的图像中。”

　　最初的 GauGAN 可以追溯到 2019 年。它是在 Flickr 平台上的公共图像上进行训练的。

　　第一个版本只接受了超过 100 万张图片的训练。然而，GauGAN2 接受了 10 倍的训练，并且可以理解与景观相关的自然语言描述。

　　GauGAN 的第一次迭代被重新打包为 Nvidia Canvas，这是一款适用于任何 RTX GPU 用户的测试版免费应用程序。

　　英伟达表示，该公司新发布的 GauGAN2 演示是“第一个在单个 GAN 框架内结合多种模式（文本、语义分割、草图和样式）”。

　　“这使得将艺术家的愿景变成高质量的 AI 生成图像变得更快、更容易。”

　　该公告没有提及任何商业化计划，也没有提及它是否会与 Canvas 集成，并表示该演示“为艺术家展示了强大的图像生成工具的未来可能性”。

　　英伟达的 GauGAN2 是在其最近的 GTC 活动中无数次揭幕后不久推出的。

　　在那里，它展示了 Jetson AGX Orin，一个用于 AI 工作负载的小而强大的计算模块，Riva Custom Voice，一个可以创建“类人”语音的软件平台，以及 Omniverse Avatar，一个创建交互式 3D 表示的平台人。