混元3D:腾讯混元发布的3D开源模型

腾讯混元3D:革新3D内容创作的AI引擎

腾讯混元3D是一款开源的大规模3D资产生成系统,通过文本或图像输入快速生成高分辨率且带纹理的3D模型。其核心采用两阶段生成流程:首先生成无纹理的几何模型,再合成高分辨率纹理贴图。这种解耦设计有效分离了形状与纹理生成的复杂性,同时支持对生成模型或手工模型的灵活纹理处理。

官网体验https://3d.hunyuan.tencent.com/

混元3D:腾讯混元发布的3D开源模型

核心功能特性

1. 多模态输入支持

  • 文生3D:输入文本描述(如“卡通风格的黑白猫”),30秒内生成几何模型,120秒内完成带纹理的完整3D资产。
  • 图生3D:上传图像生成对应模型,无纹理生成仅需17秒,带纹理约102秒(基于A100显卡)。

2. 几何与纹理的高精度解耦生成

  • 几何模型
  • 使用Hunyuan3D-DiT模型(26亿参数),基于扩散Transformer架构生成高保真白模,精确匹配输入图像的结构。
  • 新增加速版DiT-v2-0-Fast,推理时间缩短50%。
  • 纹理生成
  • Hunyuan3D-Paint(13亿参数)通过多视图扩散技术合成4K纹理贴图,支持光影去除(Delight-v2-0模型)以提升材质真实性。

3. 专业级扩展功能

  • 低多边形优化:自适应减少模型面数(手游角色可低于2万面),直接适配Unity/Unreal等游戏引擎。
  • 骨骼绑定与动画:为人物模型自动绑定骨骼,支持动作模板驱动,大幅简化动画流程。
  • 工作流引擎:支持节点式多步骤生成(如图片→去背景→T-pose调整→模型生成),提升复杂场景创作效率。

应用场景与案例

游戏开发
批量生成NPC、道具和场景资产,腾讯内部项目实测美术资源制作效率提升91%。

电商与广告
商品图一键生成3D模型,支持GLB/FBX格式导出,用于交互式商品展示。

工业设计
根据草图生成产品原型(如“北欧战斧”),无缝对接3D打印工具。

教育科研
开源模型(GitHub/Hugging Face)支持研究者复现技术,适用于教学演示。

混元3D:腾讯混元发布的3D开源模型

使用方式

普通用户
访问官网在线创作,每日免费生成10次,分享邀请可获额外30次。

开发者

  • 代码库:https://github.com/Tencent/Hunyuan3D-2
  • 模型权重:https://huggingface.co/tencent/Hunyuan3D-2
  • 部署支持:
  • 本地运行需NVIDIA显卡(建议A100/A40);
  • 轻量版Hunyuan3D-2mini可部署于RTX 4080或苹果M1 Pro芯片。

产品评测:优势与挑战

优势

  • 生成质量领先:在CMMD、FID等指标上超越现有开源/闭源模型,几何锐利度与纹理稳定性显著提升。
  • 全流程覆盖:从建模、贴图到动画的一站式解决,降低3D创作门槛。
  • 开源生态完善:提供Gradio应用、Blender插件及API,灵活适配不同需求。

待优化点

  • 生成耗时较长:纹理合成需87秒以上,成为性能瓶颈;
  • 细节局限性:复杂肢体(如手指)和面部仍有畸变概率;
  • 硬件要求高:高精度生成依赖高端GPU,消费级设备需使用轻量版模型。

腾讯计划通过模型压缩与API标准化持续优化,推动3D AIGC在影视虚拟拍摄、工业数字孪生等场景落地。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧