全部标签

AI训练模型

最新最多浏览

文心大模型4.5：百度推出的新一代原生多模态基础大模型

文心大模型4.5是百度推出的新一代原生多模态基础大模型，通过多个模态联合建模实现协同优化，多模态理解能力优秀；具备更精进的语言能力，理解、生成、逻辑、记忆能力全面提升，去幻觉、逻辑推理、代码能力显著提升。
DeepSeek-V3：DeepSeek推出的开源自研 MoE 模型，性能与速度全面突破

DeepSeek-V3 是由深度求索公司推出的一款全新发布的自研 MoE（混合专家）模型，旨在突破当前大语言模型的性能瓶颈。通过 671B 参数和 37B 激活专家，DeepSeek-V3 在 14.8T token 的大规模预训练上取得了显著进展，展现出与世界顶尖闭源模型（如 GPT-4o 和 Claude-3.5-Sonnet）相当的表现。该模型在多项标准评测中超越了 Qwen2.5-72B …
MatterGen：微软推出的无机材料设计AI模型，辅助生成新材料

MatterGen 是微软推出的基于生成性AI的材料设计模型，利用扩散模型生成具有特定化学、机械、电子或磁性属性的新材料。它能够高效生成稳定、独特的材料，超越传统筛选方法，快速探索未知材料空间。
MusicGen-简单可控的音乐生成模型

MusicGen 是一个由Meta发布的开源 AI 音乐生成模型，可以根据文本输入生成新的音乐片段
淘宝星辰大模型-淘宝天猫集团推出的AI大模型

淘宝星辰大模型是淘宝天猫集团自研的首个公开大模型，专为电商和生活服务场景设计，提供文案生成、多轮会话、知识问答和智能决策等功能。
讯飞星火开源大模型

讯飞星火开源大模型是科大讯飞对外开源的大模型。讯飞星火开源-13B（iFlytekSpark-13B）拥有130亿参数，在经过累计超过3万亿以上tokens海量高质量数据集上进行预训练，然后在精调的多元化对齐数据上进行微调得到。iFlytekSpark-13B在多个标准评估中展现出了卓越的性能，其表现优于同参数量级的开源模型，与一些闭源模型相比不相上下。
Qwen2.5-Omni：阿里推出的新一代端到端多模态模型

Qwen2.5-Omni是阿里巴巴通义团队推出的一款全模态大语言模型。它能够处理多种输入形式，包括文本、音频、图像和视频，并生成相应的输出。
百度正式开源文心4.5系列模型

2025年6月30日，百度宣布文心4.5系列模型正式开源。此次开源包括10款不同规模的模型，其中包括参数量为47B和3B的混合专家（MoE）模型，以及0.3B的稠密参数模型。文心4.5的开源文件包括预训练权重和推理代码，已上传至Hugging Face、GitHub以及飞桨星河社区，供全球开发者使用。主要技术特点 1. 多模态混合专家模型预训练文心4.5通过联合训练文本和视觉两种模态来提高模型…
Gemma-谷歌发布的最新开放模型，小尺寸可商用

Gemma是谷歌最新发布的一款开放模型，属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术，是一个小尺寸的大语言模型。
Step-1V：阶跃星辰推出的千亿参数多模态大模型

Step-1V是阶跃星辰研发的一款千亿参数的多模态大模型。这个模型在多个领域表现出色，特别是在图像理解、多轮指令跟随、数学能力、逻辑推理和文本创作等方面。
Skywork R1V：昆仑万维开源的多模态视觉思维链推理模型

Skywork R1V 是昆仑万维开源的多模态视觉思维链推理模型，专注于通过多步逻辑推理解决复杂的视觉任务。它结合了强大的文本推理能力和视觉理解能力，能够处理视觉逻辑推理、数学问题、科学现象分析等任务。
阿里云百炼-一站式大模型服务平台

阿里云提供的一站式大模型服务平台，旨在帮助企业和开发者快速构建、部署和应用大规模人工智能模型。
通义万相Wan2.1- 阿里推出的开源视频生成大模型

通义万相Wan2.1是阿里巴巴推出的开源视频生成大模型，专注于从文本生成高质量图像和视频。Wan2.1 在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势，无论是创作者、开发者还是企业用户，都可以根据自己的需求选择合适的模型和功能，轻松实现高质量的视频生成。
PixArt-华为发布的AI图像生成模型，支持生成4K图像

PIXART-Σ 是一个由华为发布的扩散变换器模型，专门用于4K分辨率的文本到图像生成。
CogView4 – 智谱推出的开源文生图模型，支持汉字生成

CogView4是北京智谱华章推出的开源文生图模型，支持中英双语输入，擅长生成含汉字图像。它在DPG-Bench测试中排名第一，性能卓越。具备任意分辨率生成和长提示词输入能力，技术领先，遵循Apache 2.0协议，适用于广告、短视频等创意领域。
VideoWorld：豆包等推出的开源视频生成模型，从无标签视频中学习知识

VideoWorld是豆包大模型团队联合北京交通大学、中国科学技术大学共同开发的视频生成实验模型，通过无标注的视频数据训练，探索AI如何从视觉输入中学习复杂任务。
荀子古籍大语言模型

荀子古籍大语言模型是南京农业大学信息管理学院王东波教授团队在北京发布的进行古籍处理和研究的智能工具。
360智脑

360智脑是一个由 360 公司开发的 AI 平台，旨在探索全新的人机协作模式，激活用户的创造力和想象力。它提供了一系列的 AI 工具和服务，包括 API 开放平台、360鸿图、360AI搜索、360AI浏览器、360智脑桌面版和企业数字员工等。
GO-1：智元推出的首个通用具身基座模型

GO-1是什么？ GO-1是智元机器人发布的通用具身基座大模型，采用ViLLA架构，结合视觉、语言、隐式动作和执行能力。它通过学习人类视频和少量样本泛化新任务，支持多机器人形态并持续进化。GO-1代表了具身智能向通用化、智能化发展的新阶段，预示着机器人将具备更广泛的应用潜力。 GO-1的主要特点 ViLLA架构：GO-1采用Vision-Language-Latent-Action (ViLLA)…
Seed1.5-VL：字节跳动推出的视觉-语言多模态基础模型

Seed1.5-VL 是字节跳动推出的视觉-语言多模态基础模型，结合图像编码器与200亿激活参数的大语言模型，具备出色的图像、视频理解与推理能力。在60项基准测试中获得38项SOTA，广泛应用于视频问答、图表理解、GUI智能体等任务，表现稳定、推理强大。
HithinkGPT-同花顺推出的问财大模型

重磅发布。
QwQ-32B：阿里云开源的最新AI推理模型，更小尺寸，消费级显卡即可部署

QwQ-32B 是阿里云开源的320亿参数推理模型，具备强大的数学、代码和通用推理能力，性能比肩全球顶尖开源模型。它支持消费级显卡部署，降低硬件门槛，同时集成智能体能力，可灵活调整推理过程。采用Apache 2.0协议开源，用户可免费下载、商用和定制化开发，推动AI技术的广泛应用。
昆仑大模型：中国石油等联合发布的能源行业大模型

昆仑大模型是由中国石油、中国移动、华为和科大讯飞联合打造的能源行业大模型。昆仑大模型具备330亿参数，并已通过国家生成式人工智能服务备案，是中国能源化工行业首个通过备案的大模型。其主要目标是推动能源行业的智能化发展，通过创新的四层架构支持油气新能源、炼化新材料等领域的大规模数据建模。
ACE-Step：阶跃星辰和ACE Studio联合发布的开源音乐基础模型

ACE-Step 是由阶跃星辰与 ACE Studio 联合开源的音乐大模型，旨在为音乐爱好者提供高效、灵活且高质量的音乐创作工具。该模型参数量为 3.5B，具备多语言支持、快速生成、强可控性及易于拓展等特点，支持多种音乐创作场景，如音频编辑、人声合成、伴奏生成等。

{{userData.name}}已认证

AI训练模型