-
HunyuanCustom:腾讯混元开源的多模态定制化视频生成工具
视频制作不用摄像机?腾讯混元HunyuanCustom:AI视频生成工具,输入文本/图片即可生成4K视频,解决身份漂移难题,保真度达92%。电商与教育创作者必备,提升10倍制作效率,立即体验高效视频创作。 -
通义万相Wan2.2- 阿里推出的开源视频生成大模型
🎬 视频制作迎来"自动驾驶"时代!这个AI模型让好莱坞级特效触手可及 做视频最头疼什么?特效制作绝对排第一。阿里推出的通义万相Wan2.2正在改变这个现状,这个开源视频生成大模型能让普通人也能做出专业级视频。只需要输入文字或图片,它就能生成物理效果逼真、电影质感十足的视频内容,最关键的是完全开源免费,让每个人都能享受视频创作的乐趣。 在线体验:https://tongyi.al… -
GitAgent-面壁智能联合清华大学发布的大模型智能体应用框架
🔍 GitAgent 框架:大模型智能体的工具箱革命 GitAgent 是由面壁智能与清华大学自然语言处理实验室联合研发的创新型框架,旨在解决大模型智能体在复杂任务中的工具扩展瓶颈。其核心突破在于赋予智能体自主从 GitHub 挖掘、配置并应用工具的能力,通过四阶段流程动态扩展工具箱,显著提升任务解决效率。 🔧 四阶段工具箱扩展流程 智能搜索阶段系统基于用户需求,在 GitHub 海量仓库中精准筛… -
灵医Bot:百度旗下医疗健康AI大模型
灵医Bot:百度推出的AI健康助手,能看病吗? 灵医Bot是百度“灵医智惠”品牌推出的医疗健康大模型,它基于百度的文心大模型技术,并学习了全国800多家医院和4000多家基层医疗机构的真实诊疗经验。这款AI工具主要为医生和医疗机构提供临床辅助、患者服务和医疗管理等方面的智能支持,旨在提升医疗效率和质量,但它不能替代医生进行诊断。 产品入口:https://01.baidu.com 🩺 核心功能:它… -
SkyReels-V1:昆仑万维开源的AI短剧创作视频生成模型
🎬 SkyReels-V1是什么? 昆仑万维开源的中国首个AI短剧生成神器,专攻影视级人物表演!它能精准操控角色口型、表情和动作,自带33种微表情和400+自然动作库,连“不屑挑眉”“绝望瘫坐”这种细节都能拿捏。更绝的是支持图生视频——上传一张汉服少女草图,直接输出竹林舞剑的动态片段,好莱坞级光影质感拉满。 官网直达(2025开源免费版):skyreels.ai 🚀 核心功能:让普通人秒变AI导演… -
CogView4 – 智谱推出的开源文生图模型,让文字秒变高清大图
不会设计也能做海报?智谱CogView4开源文生图模型:精准生成汉字,免费商用,支持中英文双语描述与任意分辨率输出。立即了解,轻松生成高清海报/插画/配图。 -
Claude 3.5-Anthropic推出的新一代AI大模型
🤖 Claude 3.5是什么? Claude 3.5 Sonnet是Anthropic在2025年AI大战中的王炸级产品,作为Claude 3.5家族的首发型号,它用中端价格干翻顶级性能——推理速度比自家上代旗舰Opus快2倍,成本却只有1/5!在编程、视觉解析、长文本处理上碾压GPT-4o,被开发者称为“性价比卷王”💥。2025年8月最新升级版已支持代码实时协作和多模态工作流,成为企业级AI的… -
-
Step-3:阶跃星辰推出的千亿参数多模态大模型
开篇:国产大模型的新突破 AI大模型领域又添新成员。Step-3是阶跃星辰推出的千亿参数多模态大模型,能同时处理文字、图片、视频等多种信息。这款国产AI在逻辑推理和长文本处理方面表现突出,旨在推动各行业智能化升级。 官网链接:https://platform.stepfun.com 🚀 产品定位与核心价值 Step-3不是单一功能的AI工具。它集成了理解、分析、创作等多种能力,像一个全能的智能助手… -
火山方舟-一站式大模型服务平台
火山方舟是什么?企业级大模型服务平台 火山方舟是字节跳动火山引擎推出的一站式大模型服务平台,专门为企业提供模型训练、推理、评测和精调等全栈式AI服务。平台通过安全沙箱和硬件加密技术保障数据安全,集成了多家顶尖机构的大模型,让企业能够像使用水电煤一样方便地调用AI能力,大幅降低AI应用的门槛和成本。 官网地址:https://www.volcengine.com/product/ark ✨ 核心功能… -
Champ-基于3D的人物图像到动画视频生成框架
🤖 Champ是什么? 阿里+南大+复旦联手打造的虚拟人动作黑科技!Champ可不是普通动画工具,它能把你随手拍的小视频变成专业级3D动画——无论跳舞、打拳还是走猫步,AI都能精准捕捉每个关节运动,连头发丝飘动都真实到离谱!最绝的是还能玩“灵魂转移”:把A的舞姿完美复制到B身上,网红拍同款神舞再也不用苦练啦~ 👉 官网直达:https://fudan-generative-vision.githu… -
GO-1:智元推出的首个通用具身基座模型
机器人看视频学技能?GO-1大模型通过观看人类视频让机器人快速掌握复杂操作,小样本泛化降低90%训练成本,一脑多形适配多种硬件。提升部署效率,立即了解突破性进展。 -
Qwen VLo – 阿里推出的多模态统一理解与生成模型
🔍 Qwen VLo:从“看懂”图片到“创作”图片的AI多面手 Qwen VLo是阿里云通义千问团队在2025年6月推出的一款多模态生成式AI模型。它不仅能够像传统视觉模型那样“理解”图像内容,还能根据用户的自然语言指令进行高质量的图像生成与编辑,真正实现了从“感知”世界到“描绘”世界的跨越。这款模型支持图像生成、编辑、风格转换、视觉定位等多种任务,尤其擅长处理开放式的创作指令。 你可以通过Qwe… -
猎户星空大模型
🚀 猎户星空大模型是什么? 猎户星空大模型(Orion-14B)是专为企业级场景打造的多语言AI模型,2025年最新升级版已支持320K超长上下文和多模态输入。它用2.5万亿token训练出的140亿参数“小巨人”,在千元显卡(如RTX 3060)上每秒能处理50个汉字,被网友称为“平民企业AI神器”! https://www.orionstar.com/llm.html 🔧 六大模型全家桶,按需… -
Yi大模型-零一万物发布的开源大模型
🚀 Yi大模型:中英双语的AI全能手 想让AI同时精通中文和英文?Yi大模型由李开复博士的零一万物打造,专为中英双语场景优化,理解力和逻辑推理都很强。 零一万物官网:https://www.lingyiwanwu.com/yi Yi-34B相关资源: 开源社区: Hugging Face | ModelScope |GitHub Yi-6B相关资源: 开源社区: Hugging Face | Mo… -
gpt-realtime – OpenAI最新推出的语音模型
OpenAI GPT-Realtime语音AI:实现自然实时对话,支持情感识别和多语言无缝切换。提升智能客服与语言学习体验,立即了解革命性语音技术。 -
LivePhoto:图片生成动态视频模型
🎬 想让照片动起来?LivePhoto让静态图片秒变动态视频 LivePhoto是一款由阿里巴巴、香港大学和蚂蚁集团联合研发的图片转视频AI模型,基于先进的Stable Diffusion架构,创新性地融合了运动控制技术。它能够将静态图像转换为生动的动态视频,用户只需通过文字指令就能精准控制画面中元素的运动,让照片真正"活"起来。 官网链接:https://xavierchen… -
FLUX.1 Kontext [dev]:Black Forest Labs开源的图像编辑模型
🎨 修图只会用PS?这款AI工具让你用文字就能精准编辑图片 还在为修改图片中的某个细节而头疼吗?FLUX.1 Kontext [dev]正在重新定义图像编辑的方式!这款由Black Forest Labs研发的开源图像编辑模型,基于Flow Transformer架构实现精准的局部修改与多轮迭代。只需要用自然语言描述你想修改的内容,比如"给人物添加牛仔帽"或"将背景替… -
Hyper-SD:字节跳动推出的基于SD的图像生成框架
🚀 Hyper-SD:字节跳动的AI图像加速王,1步出大片! Hyper-SD是字节跳动2025年推出的AI图像生成核武器,专治“出图慢如龟”“显卡烧冒烟”的痛点!它用轨迹分段蒸馏+人类审美驯化黑科技,把Stable Diffusion繁琐的20步生成压榨到1-8步搞定——输入“赛博猫咪”,1秒输出带机械义耳的光污染神图,速度碾压传统模型3倍,电费省下80%! 项目主页:https://hyper… -
SkySense-蚂蚁集团开发的多模态遥感基础模型
SkySense++全景解读 遥感大模型的最新进化 2025年8月,武汉大学与蚂蚁集团联合推出新一代语义增强遥感大模型SkySense++,相关成果发表于国际顶级期刊《自然·机器智能》。此次升级旨在攻克遥感技术在动态地球观测中的三大瓶颈:多模态数据融合效率低、下游任务依赖大量微调数据、语义信息挖掘不足。 新模型基于11个卫星载荷的2700万组多模态遥感影像,创新采用两阶段渐进式学习策略:第一阶段通… -
Phi-3:微软推出的开源小型语言模型,支持移动设备
Phi-4系列是什么? 微软推出的新一代轻量级AI模型,主打“小身材大能量”。包含两款核心产品:Phi-4-Mini(38亿参数,纯文本处理)和Phi-4-Multimodal(多模态模型,支持图文音)。最大亮点是在手机、笔记本等普通设备上就能流畅运行,性能却媲美参数翻倍的大模型,彻底摆脱对云端服务器的依赖。 在线体验地址:https://huggingface.co/chat/models/mi… -
SiliconCloud – 硅基流动推出的一站式大模型云服务平台
SiliconCloud:一站式AI模型超市,支持文本/视觉/代码生成,Qwen2等模型永久免费,经行业评测认可,适配中小团队低成本调用,PC首屏50字含核心三要素,移动端35字独立成段。 -
Step1X-3D:阶跃星辰开源的3D大模型,支持生成高保真可控的3D内容
不会3D建模?用嘴「说」出一个3D模型!这款国产AI工具让创作像说话一样简单 想为游戏设计一个角色却不会建模?需要产品原型但被复杂软件劝退?Step1X-3D的出现,彻底降低了3D创作的门槛。这是阶跃星辰在2025年推出的开源3D生成大模型,只需输入文字描述,几分钟内就能获得高质量3D模型,让每个人都能成为3D创作者。 官网地址:https://github.com/stepfun-ai/Step… -
dots.llm1:小红书开源的 MoE 架构大语言模型
✨ dots.llm1:小红书出品的高效AI语言模型 dots.llm1是小红书旗下人文智能实验室(hi lab) 在2025年6月开源的一款大型语言模型。它采用了先进的MoE(混合专家)架构,虽然模型总参数量高达1420亿,但在实际推理时每次只激活140亿参数。这种设计让它既能保持强大的性能,又显著降低了计算成本和响应时间,是一个非常“聪明”且“经济”的AI模型。 它基于11.2万亿高质量的真实…


















![FLUX.1 Kontext [dev]:Black Forest Labs开源的图像编辑模型](https://res.hello123.com/wp-content/uploads/2025/07/20250714140602806.webp)





