-
Ovis-U1:阿里巴巴推出的统一的多模态理解与生成模型
🎨 Ovis-U1:能看懂会创作的AI多面手 Ovis-U1是阿里巴巴国际AI团队在2025年6月底推出的统一多模态大模型,虽然只有30亿参数,却同时具备了图像理解、文字生成图像和图像编辑三大核心能力。它就像一个真正的"AI全才",既能准确描述图片内容,又能根据文字描述创作精美图像,还能按照指令精准修改现有图片,打破了传统AI模型"专精一门"的局限。 访问O… -
语鲸大模型-深言科技推出的开源中英双语大语言模型
🐳 语鲸大模型:专为中文优化的智能助手 想让AI真正理解中文的微妙之处吗?语鲸大模型(LingoWhale-8B)就是这样一个专为中文场景深度优化的大语言模型。由深言科技研发的这款开源模型,拥有80亿参数,基于数万亿高质量中英数据训练而成,特别擅长处理长文本和复杂中文语义理解,堪称中文AI助手的最佳选择。 GitHub:https://github.com/DeepLangAI/LingoWhal… -
混元DiT-腾讯最新开源的文生图AI模型
混元DiT:腾讯最新开源的文生图AI模型,让AI绘画更简单 混元DiT是腾讯推出的开源文生图模型,基于扩散变换器架构开发,能够根据文字描述快速生成高质量图像。这个模型支持中英文提示词,在人物生成、场景构建等方面表现出色,为开发者和创作者提供了一个强大且易用的AI绘画工具。 官网链接:https://hunyuan.tencent.com/ ✨ 核心功能亮点 高质量图像生成:输入文字描述即可生成细节… -
Seed-Coder:字节跳动最新推出的开源代码模型
Seed-Coder:字节跳动开源AI编程助手,用自然语言生成高质量代码,支持Python/Java/C++等多种语言。完全免费,提升开发效率,立即体验! -
华为-盘古AI大模型
华为盘古大模型系列已全面上线,包含自然语言处理(NLP)、计算机视觉(CV)及气象科学计算三大核心模型,推动AI技术在各行业落地应用。该系列通过千亿级参数规模与深度学习方法,显著提升中文理解、图像分析和气象预测能力。官网链接:华为云盘古大模型官网 一、核心模型与技术亮点 NLP大模型 能力:业界最接近人类中文理解水平的AI模型,支持文本生成、分类、问答等任务。 创新点:采用Encoder-Deco… -
Step-3:阶跃星辰推出的千亿参数多模态大模型
开篇:国产大模型的新突破 AI大模型领域又添新成员。Step-3是阶跃星辰推出的千亿参数多模态大模型,能同时处理文字、图片、视频等多种信息。这款国产AI在逻辑推理和长文本处理方面表现突出,旨在推动各行业智能化升级。 官网链接:https://platform.stepfun.com 🚀 产品定位与核心价值 Step-3不是单一功能的AI工具。它集成了理解、分析、创作等多种能力,像一个全能的智能助手… -
GitAgent-面壁智能联合清华大学发布的大模型智能体应用框架
🔍 GitAgent 框架:大模型智能体的工具箱革命 GitAgent 是由面壁智能与清华大学自然语言处理实验室联合研发的创新型框架,旨在解决大模型智能体在复杂任务中的工具扩展瓶颈。其核心突破在于赋予智能体自主从 GitHub 挖掘、配置并应用工具的能力,通过四阶段流程动态扩展工具箱,显著提升任务解决效率。 🔧 四阶段工具箱扩展流程 智能搜索阶段系统基于用户需求,在 GitHub 海量仓库中精准筛… -
-
Phi-3:微软推出的开源小型语言模型,支持移动设备
Phi-4系列是什么? 微软推出的新一代轻量级AI模型,主打“小身材大能量”。包含两款核心产品:Phi-4-Mini(38亿参数,纯文本处理)和Phi-4-Multimodal(多模态模型,支持图文音)。最大亮点是在手机、笔记本等普通设备上就能流畅运行,性能却媲美参数翻倍的大模型,彻底摆脱对云端服务器的依赖。 在线体验地址:https://huggingface.co/chat/models/mi… -
Stable Virtual Camera:Stability AI等推出的AI模型 ,2D图像轻松转3D视频
✨ Stable Virtual Camera:让图片动起来的3D视频魔法 Stable Virtual Camera是Stability AI公司推出的一个AI视频生成模型,它能把普通的2D静态图片变成带有逼真3D效果和深度感的动态视频。你只需要提供一张或几张照片,它就能模拟出相机在不同角度移动的效果,生成看起来非常专业的3D视频。 官网地址:https://stable-virtual-cam… -
HunyuanCustom:腾讯混元开源的多模态定制化视频生成工具
视频制作不用摄像机?腾讯混元HunyuanCustom:AI视频生成工具,输入文本/图片即可生成4K视频,解决身份漂移难题,保真度达92%。电商与教育创作者必备,提升10倍制作效率,立即体验高效视频创作。 -
京东言犀大模型
京东言犀大模型:产业智能化的新引擎 京东言犀大模型深度融合供应链与产业场景,专为零售、物流、金融等高知识密度领域打造。2025年升级至720B参数规模,新增多模态理解能力,强化对长文本、复杂逻辑任务的支撑,成为国内首个通过工信部“可信AI”认证的产业大模型。 官网直达:https://yanxi.jd.com 一、技术架构:全栈工具链支撑 1. 数据融合引擎 供应链知识增强:30%独家数据来自京东… -
GO-1:智元推出的首个通用具身基座模型
机器人看视频学技能?GO-1大模型通过观看人类视频让机器人快速掌握复杂操作,小样本泛化降低90%训练成本,一脑多形适配多种硬件。提升部署效率,立即了解突破性进展。 -
-
通义万相Wan2.2- 阿里推出的开源视频生成大模型
🎬 视频制作迎来"自动驾驶"时代!这个AI模型让好莱坞级特效触手可及 做视频最头疼什么?特效制作绝对排第一。阿里推出的通义万相Wan2.2正在改变这个现状,这个开源视频生成大模型能让普通人也能做出专业级视频。只需要输入文字或图片,它就能生成物理效果逼真、电影质感十足的视频内容,最关键的是完全开源免费,让每个人都能享受视频创作的乐趣。 在线体验:https://tongyi.al… -
灵医Bot:百度旗下医疗健康AI大模型
灵医Bot:百度推出的AI健康助手,能看病吗? 灵医Bot是百度“灵医智惠”品牌推出的医疗健康大模型,它基于百度的文心大模型技术,并学习了全国800多家医院和4000多家基层医疗机构的真实诊疗经验。这款AI工具主要为医生和医疗机构提供临床辅助、患者服务和医疗管理等方面的智能支持,旨在提升医疗效率和质量,但它不能替代医生进行诊断。 产品入口:https://01.baidu.com 🩺 核心功能:它… -
LivePhoto:图片生成动态视频模型
🎬 想让照片动起来?LivePhoto让静态图片秒变动态视频 LivePhoto是一款由阿里巴巴、香港大学和蚂蚁集团联合研发的图片转视频AI模型,基于先进的Stable Diffusion架构,创新性地融合了运动控制技术。它能够将静态图像转换为生动的动态视频,用户只需通过文字指令就能精准控制画面中元素的运动,让照片真正"活"起来。 官网链接:https://xavierchen… -
猎户星空大模型
🚀 猎户星空大模型是什么? 猎户星空大模型(Orion-14B)是专为企业级场景打造的多语言AI模型,2025年最新升级版已支持320K超长上下文和多模态输入。它用2.5万亿token训练出的140亿参数“小巨人”,在千元显卡(如RTX 3060)上每秒能处理50个汉字,被网友称为“平民企业AI神器”! https://www.orionstar.com/llm.html 🔧 六大模型全家桶,按需… -
Yi大模型-零一万物发布的开源大模型
🚀 Yi大模型:中英双语的AI全能手 想让AI同时精通中文和英文?Yi大模型由李开复博士的零一万物打造,专为中英双语场景优化,理解力和逻辑推理都很强。 零一万物官网:https://www.lingyiwanwu.com/yi Yi-34B相关资源: 开源社区: Hugging Face | ModelScope |GitHub Yi-6B相关资源: 开源社区: Hugging Face | Mo… -
Qwen VLo – 阿里推出的多模态统一理解与生成模型
🔍 Qwen VLo:从“看懂”图片到“创作”图片的AI多面手 Qwen VLo是阿里云通义千问团队在2025年6月推出的一款多模态生成式AI模型。它不仅能够像传统视觉模型那样“理解”图像内容,还能根据用户的自然语言指令进行高质量的图像生成与编辑,真正实现了从“感知”世界到“描绘”世界的跨越。这款模型支持图像生成、编辑、风格转换、视觉定位等多种任务,尤其擅长处理开放式的创作指令。 你可以通过Qwe… -
Step1X-3D:阶跃星辰开源的3D大模型,支持生成高保真可控的3D内容
不会3D建模?用嘴「说」出一个3D模型!这款国产AI工具让创作像说话一样简单 想为游戏设计一个角色却不会建模?需要产品原型但被复杂软件劝退?Step1X-3D的出现,彻底降低了3D创作的门槛。这是阶跃星辰在2025年推出的开源3D生成大模型,只需输入文字描述,几分钟内就能获得高质量3D模型,让每个人都能成为3D创作者。 官网地址:https://github.com/stepfun-ai/Step… -
dots.llm1:小红书开源的 MoE 架构大语言模型
✨ dots.llm1:小红书出品的高效AI语言模型 dots.llm1是小红书旗下人文智能实验室(hi lab) 在2025年6月开源的一款大型语言模型。它采用了先进的MoE(混合专家)架构,虽然模型总参数量高达1420亿,但在实际推理时每次只激活140亿参数。这种设计让它既能保持强大的性能,又显著降低了计算成本和响应时间,是一个非常“聪明”且“经济”的AI模型。 它基于11.2万亿高质量的真实… -
Matrix-Zero:昆仑万维发布的AI世界模型,支持单张图生成3D世界
平台定位与技术架构 Matrix-Zero是昆仑万维研发的下一代世界模型,包含两大核心技术模块:3D场景生成大模型和可交互视频生成大模型。通过AI将2D图像转化为可自由探索的3D空间,并支持用户实时交互操控视频生成过程,显著提升影视、游戏等领域的内容生产效率。 官网链接:https://www.kunlun.com/matrix-zero 🧩 核心功能特性 🏗️ 3D场景生成大模型 全局一致性:确… -
360智脑
360智脑是什么?360智脑是由中国科技公司360集团开发的人工智能平台,专注于推动人机协作创新,激发用户创造力。该平台整合了多种AI技术,提供开放接口和工具集,支持开发者和企业用户构建智能应用。 360智脑官网 360智脑可以做什么?平台提供一系列AI驱动工具: API开放平台:允许开发者接入AI能力,开发定制应用。 360鸿图:AI作图工具,辅助数据可视化和创意设计。 360AI搜索:智能搜索…
























