3D软件

使用NVIDIA的Magic3D从文本中生成3D模型

NvidiaGPU制造商宣布魔术3D,一种可以从文本提示中产生3D模型的生成AI。

3D建模的生成AI有助于具有复杂和有机形状的组件的概念化。3D打印是将这些形状栩栩如生的理想技术,因为它能够生产复杂的结构,同时也具有成本效益。

年度的结果3D打印行业执行调查,证明使用AI自动生成的3D模型是一个热门话题。

Magic3D在40分钟内创建具有彩色纹理的3D网格模型。这是在公司进入“坐在水上坐在水上的蓝色毒蛙”之类的提示之后。通过改进获得的结果可用于CGI艺术场景或视频游戏。nvidia概述了魔术3Dacademic paper作为对梦想,由文本到3D模型由谷歌researchers in September 2022. In other news,Physna Inc。使用8,000个型号在两周内为3D模型和场景创建了生成的AI原型。

本文的研究人员解释了该技术将如何允许任何人创建3D模型,而无需进行特殊培训。“一旦完善,最终的技术就可以加快视频游戏(和VR)的开发,并最终找到用于电影和电视的特殊效果的应用程序。我们希望通过Magic3D,我们可以将3D综合的民主化,并在3D内容创建中开放每个人的创造力。”

NVIDIA擅长进步AI。该公司的GPU可以使用着色器创建栩栩如生的图形,该图像在图像中指示每个像素如何在特定的视线中显示。为每个像素计算着着色器repetitive calculation across numerous pixels。NVIDIA GPU可以迅速渲染图像,因为它们的设计用于进行多次简单计算,例如同时进行阴影像素,这与英特尔微处理器或通用CPU不同。NVIDIA将AI应用视为关键增长驱动力,彭博社归因于$4.6 billion increase in the wealth of Nvidia founder Jensen Huang to the popularity of ChatGPT- AI聊天机器人。

Magic3D呈现为3D模型的毒龙蛙。通过NVIDIA图像。
Magic3D呈现为3D模型的毒龙蛙。通过NVIDIA图像。

魔术3D可以执行哪些任务?

Magic3D采用了一种两阶段的方法,该方法采用以低分辨率创建的粗糙模型,并将其优化为更高的分辨率,该分辨率类似于使用文本对图像模型产生2D图像的DreamFusion,然后将其优化为体积NERF(Neural辐射字段)数据。根据论文的作者,产生的魔术3D技术可以生产3D对象的速度是DreamFusion的两倍。

Magic3D还可以进行基于及时的3D网格编辑。提供基本提示和低分辨率3D模型,可以修改文本以更改所得模型。此外,Magic3D的作者说明了在多代(称为连贯性的概念)中保留相同主题的作者,并将2D图像(例如Cobist绘画)的样式实现到3D模型。

生成AI和3D打印:具有巨大潜力的未来

Physna Inc.的创始人兼首席执行官保罗·鲍尔斯(Paul Powers)分享了他关于创建公平3D生成AI的想法。首席执行官说,生成的AI征服了2022年,因此该公司决定潜水3D打印和生成AI。尽管PhysNA是一家专注于AR/VR和制造业的工程和设计应用的3D搜索和分析公司,但它在2周内仅使用只有3个工程师的8,000款模型,在2周内为3D型号和场景构建了非常基本的生成AI原型。

Powers进一步解释了该实验背后的原因。他声称,生成的AI席卷了许多行业,但在3D印刷中缺乏后面。此延迟背后的主要原因是复杂的3D模型和缺乏标记的3D数据。3D模型通常很难创建,以多种不兼容的格式产生,并且与2D模型分析(文本,图像,视频等)相比,人们受到了很少的关注。很少有企业专注于3D,因为从历史上看,这是一个很难克服的问题。

此外,Google的DreamFusion团队总结了他们的第二期文章去年。与2D数据相比,3D数据较少。Google的DreamFusion团队以与Nvidia的Magic3D团队(神经辐射场)一样的方式使用了NERF。保罗说,它们也是空的“贝壳”,因为它们缺乏几何形状和内部组件。这意味着用户不仅在手头的对象上拥有较少的信息,而且对技术的假设也很难。正如Google的DreamFusion团队指出的那样,虽然对NERFS的培训可能比对2D型号的培训更有帮助,但“ Nerfs并不是替代品真,标记为3D模型。”这意味着,在没有解决方案的情况下,生成的AI在3D中的性能不如在不久的将来其他领域的表现不错。该公司进一步进行了一些实验,以检查生成AI与3D打印的兼容性。

GPU计算如何改善3D打印?

GPU计算需要使用GPU(图形处理单元)作为加快技术和科学计算的CPU的协调员。通过卸载一些耗时和计算密集型代码,GPU加快了基于CPU的应用程序。该应用程序的其余部分继续在CPU上运行。从用户角度来看,该应用程序运行更快,因为它利用GPU的并行处理能力来增强性能。这种类型的计算被称为“混合”或“异质”计算。CPU通常具有四到八个CPU核心,而GPU通常具有数百个较小的核心。GPU从其庞大的平行结构中获得了高计算性能。

应用程序开发人员可以通过使用NVIDIA的“ CUDA”并行编程模型来利用并行GPU架构的性能。所有NVIDIA GPU都支持NVIDIA CUDA并行编程模型,包括Geforce,,,,Quadro, 和特斯拉。以前,NVIDIA引入了一种转换方式2D图像成3D模型。该框架展示了如何以类似于肉眼工作方式来推断单个图像的形状,纹理和光线。Nvidia PR专家Lauren Finkle在公司博客上写道:“当您查看此屏幕时,请闭上左眼。现在,闭上右眼并张开左眼,您会注意到视野会根据您使用的眼睛而变化。这是因为,尽管我们在二维中看到,但视网膜捕获的图像结合在一起以提供深度并产生三维的感觉。”

NVIDIA渲染框架,称为基于可区分的插值渲染器或DIB-R,具有协助和加快3D设计和机器人技术不同领域的潜力,并在几秒钟内渲染3D模型。根据Finkle的说法,我们存在的3D世界实际上是通过2D镜头观察到的,这被称为立体视觉。深度是通过通过每只眼睛合并的图像在大脑中创建的,从而给人以三维图像的印象。以相似原则起作用的Dib-R可以通过将输入从2D图像转换为地图来预测图像的形状,颜色,纹理和照明。然后,该地图被用来创建一个多边形球体,从而产生了代表原始2D图像中组件的3D模型。

在其他地方,达汉·卡姆(Daghan Cam)以前是伦敦大学学院的巴特利特建筑学院,使用GPU计算。CAM使用他的专业知识CUDA平行编程模型Nvidia GPU教他的机器人制造系统利用算法在3D打印3D打印原型之前完成其抽象设计的结构。凸轮转向波士顿有限公司实现3D在完成3D模型之后打印他的现代原型设计Quadro K6000图形卡特斯拉K40 GPU加速器。物质化的高分辨率长毛象立体光刻的打印机能够在单个作品中生产大规模和复杂的印刷品,用于3D打印原型。完整的原型是复杂的,抽象的,非常令人愉悦的眼睛,并且似乎非常适合在MOMA或LOUVRE上展示。

特征图像显示了由Magic3D作为3D模型呈现的毒龙蛙。通过NVIDIA图像。

什么是3D打印的未来抓住?

专家得到了吗3D打印的趋势去年对吗?

要了解最新的3D印刷新闻,请不要忘记订阅3D打印行业通讯或跟随我们推特,或者喜欢我们的页面Facebook

当您在这里时,为什么不订阅我们YouTube渠道?包括讨论,汇报,视频短裤和网络研讨会重播。

您是否正在寻找增材制造业的工作?访问3D打印作业在行业中选择一系列角色。

有关此主题的更多信息 用物料的模仿计划者简化胸手术