-
豆包·视觉理解模型:豆包推出的多模态AI大模型
豆包·视觉理解:能“看懂”图片的AI,到底有多聪明? 豆包·视觉理解模型是字节跳动推出的一款多模态AI大模型,它的核心能力是让AI不仅能读懂文字,还能真正“理解”图片内容。你可以直接上传一张照片,它能描述画面、回答关于图片的问题,甚至能根据图片写诗或广告文案,在中文场景下的识别准确度处于行业领先水平。 官网入口:火山引擎豆包视觉理解模型(https://www.volcengine.com/pro… -
SkySense-蚂蚁集团开发的多模态遥感基础模型
SkySense++全景解读 遥感大模型的最新进化 2025年8月,武汉大学与蚂蚁集团联合推出新一代语义增强遥感大模型SkySense++,相关成果发表于国际顶级期刊《自然·机器智能》。此次升级旨在攻克遥感技术在动态地球观测中的三大瓶颈:多模态数据融合效率低、下游任务依赖大量微调数据、语义信息挖掘不足。 新模型基于11个卫星载荷的2700万组多模态遥感影像,创新采用两阶段渐进式学习策略:第一阶段通… -
SkyReels-V1:昆仑万维开源的AI短剧创作视频生成模型
🎬 SkyReels-V1是什么? 昆仑万维开源的中国首个AI短剧生成神器,专攻影视级人物表演!它能精准操控角色口型、表情和动作,自带33种微表情和400+自然动作库,连“不屑挑眉”“绝望瘫坐”这种细节都能拿捏。更绝的是支持图生视频——上传一张汉服少女草图,直接输出竹林舞剑的动态片段,好莱坞级光影质感拉满。 官网直达(2025开源免费版):skyreels.ai 🚀 核心功能:让普通人秒变AI导演… -
Champ-基于3D的人物图像到动画视频生成框架
🤖 Champ是什么? 阿里+南大+复旦联手打造的虚拟人动作黑科技!Champ可不是普通动画工具,它能把你随手拍的小视频变成专业级3D动画——无论跳舞、打拳还是走猫步,AI都能精准捕捉每个关节运动,连头发丝飘动都真实到离谱!最绝的是还能玩“灵魂转移”:把A的舞姿完美复制到B身上,网红拍同款神舞再也不用苦练啦~ 👉 官网直达:https://fudan-generative-vision.githu… -
Kimi-Audio:Kimi开源的通用音频模型,支持语音识别、音频理解、语音对话等多种任务
AI音频处理新突破!Kimi-Audio开源模型:整合语音识别、音频理解与对话,支持多任务,免费商用。开发者必备,提升音频处理效率。 -
荀子古籍大语言模型:让普通人也能读懂文言文的AI工具
让古籍"活"起来:这款AI工具让普通人也能读懂文言文 南京农业大学与中华书局古联公司联手打造的荀子古籍大语言模型,就像一位博古通今的智能学者。这个专攻古籍处理的AI系统,基于20亿字古籍语料训练而成,能自动完成古籍标点、翻译、诗歌创作等一系列任务,让晦涩难懂的文言文变得平易近人。 可以在GitHub和ModelScope等网站免费下载使用。 基座模型XunziALLM:http… -
Claude 3.5-Anthropic推出的新一代AI大模型
🤖 Claude 3.5是什么? Claude 3.5 Sonnet是Anthropic在2025年AI大战中的王炸级产品,作为Claude 3.5家族的首发型号,它用中端价格干翻顶级性能——推理速度比自家上代旗舰Opus快2倍,成本却只有1/5!在编程、视觉解析、长文本处理上碾压GPT-4o,被开发者称为“性价比卷王”💥。2025年8月最新升级版已支持代码实时协作和多模态工作流,成为企业级AI的… -
阅文妙笔大模型:国内首个网文大模型
网文创作进入"辅助驾驶"时代:这款AI工具让写作效率翻倍 阅文妙笔就像为网络文学作家配备了一位全天候创作助理!这是阅文集团推出的国内首个网文垂类大模型,专门为网文作者打造。通过角色生成、世界观构建、场景描写等AI辅助功能,它将创作模式从"手动写作"升级为"智能辅助",让作家能够更专注于创意本身。 公司官网:https://www.yuew… -
SpeciesNet – 谷歌开源的AI模型,助力野生动物识别和保护
红外相机照片识别难?SpeciesNet:谷歌开源AI模型,自动识别2000+野生动物物种,准确率92%,结合地理数据避免误判。提升保护效率,免费使用。立即了解。 -
AniSora – Bilibili开源的动漫视频生成模型,一键生成多种风格动漫视频镜头
🎬 AniSora:一键生成动漫视频的AI魔法工具箱 AniSora是哔哩哔哩(B站)推出的开源动漫视频生成模型,专门为二次元内容创作量身定制。它能够根据文本描述或单张图片,一键生成多种风格的高质量动漫视频,包括番剧片段、国创动画、漫画改编、VTuber内容和鬼畜动画等。这个模型代表了2025年动漫视频生成领域的最新技术突破,让每个人都能轻松成为动画导演。 访问AniSora官方GitHub仓库,… -
Grok 3:马斯克旗下XAI发布的新一代AI大模型
🚀 马斯克的最新AI神器来了!Grok 3能否挑战ChatGPT? 听说过能解数学题、写代码、还能做科学研究的AI吗?埃隆·马斯克旗下的xAI团队刚刚发布了Grok 3,这个被称为"最强大脑"的新一代语言模型,正在科技圈掀起一阵风暴。它用了10万张英伟达H100显卡进行训练,总算力消耗高达2亿GPU小时,相当于一台普通电脑不停运转2万多年! 官网体验:https://grok.… -
-
ACE-Step:阶跃星辰和ACE Studio联合发布的开源音乐基础模型
AI一键生成爆款BGM?ACE-Step开源音乐模型20秒创作专业级配乐,支持中文歌词和结构精准控制。免费商用,立即体验音乐制作革命。 -
-
Mind GPT:理想汽车发布的多模态大模型
车载多模态认知大模型 Mind GPT是理想汽车全栈自研的车载AI系统,深度融合语音交互、环境感知与车辆控制能力。无需唤醒词即可响应全车指令,覆盖111个用车场景的千余项专属功能,实现“人车自然对话”的智能座舱体验。 车主中心入口:https://www.lixiang.com/owner 核心能力解析 1. 场景化交互革命 全时免唤醒:全车四音区直接下达指令(例:“后排空调调至24度”) 方言自… -
-
ALLaM – 专为阿拉伯语设计的AI大语言模型
阿拉伯语AI听不懂方言?ALLaM模型:专为阿拉伯语优化,精通沙特方言与文化适配,支持古籍数字化与智能客服。提升40%处理效率,开发者与企业首选。立即了解。 -
Audiobox-Meta推出的新一代音频生成模型
Meta Audiobox是什么? Meta推出的新一代AI音频生成工具,用声音+文字指令就能定制各类音效、人声和环境音。比如录一段自己说话,输入“变成新闻主播腔调,背景加入雨声”,就能生成带场景的播报音频。2025年新增中文支持,个人创作者和影视团队都在用。 https://ai.meta.com/audiobox 核心功能:声音自由定制 1. 语音克隆+风格迁移 上传10秒人声样本→生成相同音… -
Step-Video-TI2V:阶跃星辰开源的AI图生视频模型
🎬 Step-Video-TI2V:开源图生视频新王者,运动可控+102帧长视频生成 Step-Video-TI2V是阶跃星辰(StepFun)在2025年3月开源的一款重磅图生视频模型,它基于300亿参数的Step-Video-T2V训练而成。简单说,你给它一张图片和一段文字描述,它就能帮你生成一段最长102帧(约4-5秒)、540P分辨率的动态视频,而且你对视频里的“动感”程度和镜头运动方式还… -
千帆大模型平台-百度推出的大模型与AI应用开发服务平台
文心千帆:企业级大模型服务平台 文心千帆是百度智能云推出的一站式企业级大模型生产平台,整合文心一言等百度自研大模型及开发工具链,支持企业定制专属AI模型,覆盖智能问答、内容创作、数字人直播等场景,助力千行百业实现智能化升级。 官网链接:访问文心千帆平台 核心功能 全流程模型开发 智能推理:直接调用文心大模型,支持实时生成PPT、旅游规划、直播话术等高复杂度任务。 模型微调:企业通过少量精标数据(最… -
Gen-4:Runway推出的新一代AI视频生成模型
想快速制作专业视频?Runway Gen-4:AI视频生成模型,支持文本/图像生成影视级内容,精准动态控制与200+风格。提升广告片、特效制作效率,降低90%成本。立即了解,实现高质量视频创作。 -
豆包大模型-字节跳动推出的系列大语言模型
豆包大模型:字节跳动研发的多模态AI工具,支持128K长文本处理及方言语音识别,适配企业成本敏感型业务,通过国家信息安全等级保护三级认证,Lite版成本为行业平均1/3。 -
AnimateDiff-Lightning:字节发布的快速生成视频的AI模型
⚡ AnimateDiff-Lightning是什么? AnimateDiff-Lightning是字节跳动2025年重磅升级的 AI视频生成闪电侠,核心黑科技是 “渐进式对抗扩散蒸馏” ——把传统几十步的视频生成压缩到 4-8步搞定!1080P高清视频最快 11秒出片,还能无缝兼容赛博朋克、水墨国风等 200+艺术风格,连头发丝飘动都自然到以假乱真,彻底告别“PPT式动画”黑历史! 官网入口:立… -
语鲸大模型-深言科技推出的开源中英双语大语言模型
🐳 语鲸大模型:专为中文优化的智能助手 想让AI真正理解中文的微妙之处吗?语鲸大模型(LingoWhale-8B)就是这样一个专为中文场景深度优化的大语言模型。由深言科技研发的这款开源模型,拥有80亿参数,基于数万亿高质量中英数据训练而成,特别擅长处理长文本和复杂中文语义理解,堪称中文AI助手的最佳选择。 GitHub:https://github.com/DeepLangAI/LingoWhal…
























