全部标签

AI训练模型

最新最多浏览

GPT-4o mini：OpenAI最新推出的AI模型，更快更便宜更智能

GPT-4o mini是由OpenAI推出的一款高性价比小型模型，具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异，在 MMLU 上得分 82%，目前优于 GPT-4，比 GPT-3.5 Turbo 便宜 60% 以上。目前支持文本和视觉，未来将支持更多形式。
昆仑万维-天工AI大模型

天工作为一款大型语言模型，拥有强大的自然语言处理和智能交互能力，能够实现智能问答、聊天互动、文本生成等多种应用场景，并且具有丰富的知识储备，涵盖科学、技术、文化、艺术、历史等领域。
Step-Video-T2V：阶跃星辰推出的开源视频生成大模型

Step-Video-T2V是阶跃星辰与吉利联合开源的一款高性能视频生成大模型，具备300亿参数量，能够生成540P分辨率的高质量视频。它支持复杂运动场景、精准镜头控制和生动人物生成，能够根据文本输入生成符合物理规律的视频。
Skywork R1V：昆仑万维开源的多模态视觉思维链推理模型

Skywork R1V 是昆仑万维开源的多模态视觉思维链推理模型，专注于通过多步逻辑推理解决复杂的视觉任务。它结合了强大的文本推理能力和视觉理解能力，能够处理视觉逻辑推理、数学问题、科学现象分析等任务。
DeepSeek-V3：DeepSeek推出的开源自研 MoE 模型，性能与速度全面突破

DeepSeek-V3 是由深度求索公司推出的一款全新发布的自研 MoE（混合专家）模型，旨在突破当前大语言模型的性能瓶颈。通过 671B 参数和 37B 激活专家，DeepSeek-V3 在 14.8T token 的大规模预训练上取得了显著进展，展现出与世界顶尖闭源模型（如 GPT-4o 和 Claude-3.5-Sonnet）相当的表现。该模型在多项标准评测中超越了 Qwen2.5-72B …
MatterGen：微软推出的无机材料设计AI模型，辅助生成新材料

MatterGen 是微软推出的基于生成性AI的材料设计模型，利用扩散模型生成具有特定化学、机械、电子或磁性属性的新材料。它能够高效生成稳定、独特的材料，超越传统筛选方法，快速探索未知材料空间。
CogView4 – 智谱推出的开源文生图模型，支持汉字生成

CogView4是北京智谱华章推出的开源文生图模型，支持中英双语输入，擅长生成含汉字图像。它在DPG-Bench测试中排名第一，性能卓越。具备任意分辨率生成和长提示词输入能力，技术领先，遵循Apache 2.0协议，适用于广告、短视频等创意领域。
MusicGen-简单可控的音乐生成模型

MusicGen 是一个由Meta发布的开源 AI 音乐生成模型，可以根据文本输入生成新的音乐片段
淘宝星辰大模型-淘宝天猫集团推出的AI大模型

淘宝星辰大模型是淘宝天猫集团自研的首个公开大模型，专为电商和生活服务场景设计，提供文案生成、多轮会话、知识问答和智能决策等功能。
讯飞星火开源大模型

讯飞星火开源大模型是科大讯飞对外开源的大模型。讯飞星火开源-13B（iFlytekSpark-13B）拥有130亿参数，在经过累计超过3万亿以上tokens海量高质量数据集上进行预训练，然后在精调的多元化对齐数据上进行微调得到。iFlytekSpark-13B在多个标准评估中展现出了卓越的性能，其表现优于同参数量级的开源模型，与一些闭源模型相比不相上下。
GO-1：智元推出的首个通用具身基座模型

GO-1是什么？ GO-1是智元机器人发布的通用具身基座大模型，采用ViLLA架构，结合视觉、语言、隐式动作和执行能力。它通过学习人类视频和少量样本泛化新任务，支持多机器人形态并持续进化。GO-1代表了具身智能向通用化、智能化发展的新阶段，预示着机器人将具备更广泛的应用潜力。 GO-1的主要特点 ViLLA架构：GO-1采用Vision-Language-Latent-Action (ViLLA)…
百度正式开源文心4.5系列模型

2025年6月30日，百度宣布文心4.5系列模型正式开源。此次开源包括10款不同规模的模型，其中包括参数量为47B和3B的混合专家（MoE）模型，以及0.3B的稠密参数模型。文心4.5的开源文件包括预训练权重和推理代码，已上传至Hugging Face、GitHub以及飞桨星河社区，供全球开发者使用。主要技术特点 1. 多模态混合专家模型预训练文心4.5通过联合训练文本和视觉两种模态来提高模型…
Gemma-谷歌发布的最新开放模型，小尺寸可商用

Gemma是谷歌最新发布的一款开放模型，属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术，是一个小尺寸的大语言模型。
Step-1V：阶跃星辰推出的千亿参数多模态大模型

Step-1V是阶跃星辰研发的一款千亿参数的多模态大模型。这个模型在多个领域表现出色，特别是在图像理解、多轮指令跟随、数学能力、逻辑推理和文本创作等方面。
ACE-Step：阶跃星辰和ACE Studio联合发布的开源音乐基础模型

ACE-Step 是由阶跃星辰与 ACE Studio 联合开源的音乐大模型，旨在为音乐爱好者提供高效、灵活且高质量的音乐创作工具。该模型参数量为 3.5B，具备多语言支持、快速生成、强可控性及易于拓展等特点，支持多种音乐创作场景，如音频编辑、人声合成、伴奏生成等。
阿里云百炼-一站式大模型服务平台

阿里云提供的一站式大模型服务平台，旨在帮助企业和开发者快速构建、部署和应用大规模人工智能模型。
通义万相Wan2.1- 阿里推出的开源视频生成大模型

通义万相Wan2.1是阿里巴巴推出的开源视频生成大模型，专注于从文本生成高质量图像和视频。Wan2.1 在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势，无论是创作者、开发者还是企业用户，都可以根据自己的需求选择合适的模型和功能，轻松实现高质量的视频生成。
PixArt-华为发布的AI图像生成模型，支持生成4K图像

PIXART-Σ 是一个由华为发布的扩散变换器模型，专门用于4K分辨率的文本到图像生成。
文心大模型X1：百度推出的新一代深度思考模型

文心大模型X1是百度发布的新一代深度思考模型，具备强大的理解、规划、反思和进化能力，支持多模态输入输出以及多种工具调用。它在中文知识问答、文学创作、复杂计算等方面表现出色，性能对标DeepSeek-R1，但API调用价格仅为一半。
VideoWorld：豆包等推出的开源视频生成模型，从无标签视频中学习知识

VideoWorld是豆包大模型团队联合北京交通大学、中国科学技术大学共同开发的视频生成实验模型，通过无标注的视频数据训练，探索AI如何从视觉输入中学习复杂任务。
荀子古籍大语言模型

荀子古籍大语言模型是南京农业大学信息管理学院王东波教授团队在北京发布的进行古籍处理和研究的智能工具。
360智脑

360智脑是一个由 360 公司开发的 AI 平台，旨在探索全新的人机协作模式，激活用户的创造力和想象力。它提供了一系列的 AI 工具和服务，包括 API 开放平台、360鸿图、360AI搜索、360AI浏览器、360智脑桌面版和企业数字员工等。
Step1X-Edit：阶跃星辰推出的开源图像编辑大模型

Step1X-Edit 是一款开源的图像编辑模型，具备语义精准解析、身份一致性保持和高精度区域级控制等核心能力，支持多种高频图像编辑任务。
Seed1.5-VL：字节跳动推出的视觉-语言多模态基础模型

Seed1.5-VL 是字节跳动推出的视觉-语言多模态基础模型，结合图像编码器与200亿激活参数的大语言模型，具备出色的图像、视频理解与推理能力。在60项基准测试中获得38项SOTA，广泛应用于视频问答、图表理解、GUI智能体等任务，表现稳定、推理强大。

{{userData.name}}已认证

AI训练模型