全部标签

AI大模型

最新最多浏览

豆包·视觉理解模型：豆包推出的多模态AI大模型

豆包·视觉理解：能“看懂”图片的AI，到底有多聪明？豆包·视觉理解模型是字节跳动推出的一款多模态AI大模型，它的核心能力是让AI不仅能读懂文字，还能真正“理解”图片内容。你可以直接上传一张照片，它能描述画面、回答关于图片的问题，甚至能根据图片写诗或广告文案，在中文场景下的识别准确度处于行业领先水平。官网入口：火山引擎豆包视觉理解模型（https://www.volcengine.com/pro…
SkySense-蚂蚁集团开发的多模态遥感基础模型

SkySense++全景解读遥感大模型的最新进化 2025年8月，武汉大学与蚂蚁集团联合推出新一代语义增强遥感大模型SkySense++，相关成果发表于国际顶级期刊《自然·机器智能》。此次升级旨在攻克遥感技术在动态地球观测中的三大瓶颈：多模态数据融合效率低、下游任务依赖大量微调数据、语义信息挖掘不足。新模型基于11个卫星载荷的2700万组多模态遥感影像，创新采用两阶段渐进式学习策略：第一阶段通…
SkyReels-V1：昆仑万维开源的AI短剧创作视频生成模型

🎬 SkyReels-V1是什么？昆仑万维开源的中国首个AI短剧生成神器，专攻影视级人物表演！它能精准操控角色口型、表情和动作，自带33种微表情和400+自然动作库，连“不屑挑眉”“绝望瘫坐”这种细节都能拿捏。更绝的是支持图生视频——上传一张汉服少女草图，直接输出竹林舞剑的动态片段，好莱坞级光影质感拉满。官网直达（2025开源免费版）：skyreels.ai 🚀 核心功能：让普通人秒变AI导演…
Champ-基于3D的人物图像到动画视频生成框架

🤖 Champ是什么？阿里+南大+复旦联手打造的虚拟人动作黑科技！Champ可不是普通动画工具，它能把你随手拍的小视频变成专业级3D动画——无论跳舞、打拳还是走猫步，AI都能精准捕捉每个关节运动，连头发丝飘动都真实到离谱！最绝的是还能玩“灵魂转移”：把A的舞姿完美复制到B身上，网红拍同款神舞再也不用苦练啦～ 👉 官网直达：https://fudan-generative-vision.githu…
Kimi-Audio：Kimi开源的通用音频模型，支持语音识别、音频理解、语音对话等多种任务

AI音频处理新突破！Kimi-Audio开源模型：整合语音识别、音频理解与对话，支持多任务，免费商用。开发者必备，提升音频处理效率。
荀子古籍大语言模型：让普通人也能读懂文言文的AI工具

让古籍"活"起来：这款AI工具让普通人也能读懂文言文南京农业大学与中华书局古联公司联手打造的荀子古籍大语言模型，就像一位博古通今的智能学者。这个专攻古籍处理的AI系统，基于20亿字古籍语料训练而成，能自动完成古籍标点、翻译、诗歌创作等一系列任务，让晦涩难懂的文言文变得平易近人。可以在GitHub和ModelScope等网站免费下载使用。基座模型XunziALLM：http…
Claude 3.5-Anthropic推出的新一代AI大模型

🤖 Claude 3.5是什么？ Claude 3.5 Sonnet是Anthropic在2025年AI大战中的王炸级产品，作为Claude 3.5家族的首发型号，它用中端价格干翻顶级性能——推理速度比自家上代旗舰Opus快2倍，成本却只有1/5！在编程、视觉解析、长文本处理上碾压GPT-4o，被开发者称为“性价比卷王”💥。2025年8月最新升级版已支持代码实时协作和多模态工作流，成为企业级AI的…
阅文妙笔大模型：国内首个网文大模型

网文创作进入"辅助驾驶"时代：这款AI工具让写作效率翻倍阅文妙笔就像为网络文学作家配备了一位全天候创作助理！这是阅文集团推出的国内首个网文垂类大模型，专门为网文作者打造。通过角色生成、世界观构建、场景描写等AI辅助功能，它将创作模式从"手动写作"升级为"智能辅助"，让作家能够更专注于创意本身。公司官网：https://www.yuew…
SpeciesNet – 谷歌开源的AI模型，助力野生动物识别和保护

红外相机照片识别难？SpeciesNet：谷歌开源AI模型，自动识别2000+野生动物物种，准确率92%，结合地理数据避免误判。提升保护效率，免费使用。立即了解。
AniSora – Bilibili开源的动漫视频生成模型，一键生成多种风格动漫视频镜头

🎬 AniSora：一键生成动漫视频的AI魔法工具箱 AniSora是哔哩哔哩（B站）推出的开源动漫视频生成模型，专门为二次元内容创作量身定制。它能够根据文本描述或单张图片，一键生成多种风格的高质量动漫视频，包括番剧片段、国创动画、漫画改编、VTuber内容和鬼畜动画等。这个模型代表了2025年动漫视频生成领域的最新技术突破，让每个人都能轻松成为动画导演。访问AniSora官方GitHub仓库，…
Grok 3：马斯克旗下XAI发布的新一代AI大模型

🚀 马斯克的最新AI神器来了！Grok 3能否挑战ChatGPT？听说过能解数学题、写代码、还能做科学研究的AI吗？埃隆·马斯克旗下的xAI团队刚刚发布了Grok 3，这个被称为"最强大脑"的新一代语言模型，正在科技圈掀起一阵风暴。它用了10万张英伟达H100显卡进行训练，总算力消耗高达2亿GPU小时，相当于一台普通电脑不停运转2万多年！官网体验：https://grok.…
蓝心大模型BlueLM：vivo自主研发的人工智能大模型

蓝心大模型：手机端运行AI大模型，支持文案生成、代码编程与多语言翻译。开源免费，获取移动端App下载与API接入指南。
ACE-Step：阶跃星辰和ACE Studio联合发布的开源音乐基础模型

AI一键生成爆款BGM？ACE-Step开源音乐模型20秒创作专业级配乐，支持中文歌词和结构精准控制。免费商用，立即体验音乐制作革命。
混元3D：腾讯混元发布的3D开源模型

腾讯混元3D：开源3D生成工具，支持文/图生3D全流程，适配游戏/电商/工业设计场景，经实测提升美术资源效率91%，腾讯官方开源背书。
Mind GPT：理想汽车发布的多模态大模型

车载多模态认知大模型 Mind GPT是理想汽车全栈自研的车载AI系统，深度融合语音交互、环境感知与车辆控制能力。无需唤醒词即可响应全车指令，覆盖111个用车场景的千余项专属功能，实现“人车自然对话”的智能座舱体验。车主中心入口：https://www.lixiang.com/owner 核心能力解析 1. 场景化交互革命全时免唤醒：全车四音区直接下达指令（例：“后排空调调至24度”）方言自…
银河大模型-教育AI大模型，用AI辅导孩子学习

作业帮银河大模型：AI智能辅导孩子学习，支持数学解题、作文批改和错题分析，免费使用提分明显。覆盖K12全学科，立即体验高效学习助手。
ALLaM – 专为阿拉伯语设计的AI大语言模型

阿拉伯语AI听不懂方言？ALLaM模型：专为阿拉伯语优化，精通沙特方言与文化适配，支持古籍数字化与智能客服。提升40%处理效率，开发者与企业首选。立即了解。
Audiobox-Meta推出的新一代音频生成模型

Meta Audiobox是什么？ Meta推出的新一代AI音频生成工具，用声音+文字指令就能定制各类音效、人声和环境音。比如录一段自己说话，输入“变成新闻主播腔调，背景加入雨声”，就能生成带场景的播报音频。2025年新增中文支持，个人创作者和影视团队都在用。 https://ai.meta.com/audiobox 核心功能：声音自由定制 1. 语音克隆+风格迁移上传10秒人声样本→生成相同音…
Step-Video-TI2V：阶跃星辰开源的AI图生视频模型

🎬 Step-Video-TI2V：开源图生视频新王者，运动可控+102帧长视频生成 Step-Video-TI2V是阶跃星辰（StepFun）在2025年3月开源的一款重磅图生视频模型，它基于300亿参数的Step-Video-T2V训练而成。简单说，你给它一张图片和一段文字描述，它就能帮你生成一段最长102帧（约4-5秒）、540P分辨率的动态视频，而且你对视频里的“动感”程度和镜头运动方式还…
千帆大模型平台-百度推出的大模型与AI应用开发服务平台

文心千帆：企业级大模型服务平台文心千帆是百度智能云推出的一站式企业级大模型生产平台，整合文心一言等百度自研大模型及开发工具链，支持企业定制专属AI模型，覆盖智能问答、内容创作、数字人直播等场景，助力千行百业实现智能化升级。官网链接：访问文心千帆平台核心功能全流程模型开发智能推理：直接调用文心大模型，支持实时生成PPT、旅游规划、直播话术等高复杂度任务。模型微调：企业通过少量精标数据（最…
Gen-4：Runway推出的新一代AI视频生成模型

想快速制作专业视频？Runway Gen-4：AI视频生成模型，支持文本/图像生成影视级内容，精准动态控制与200+风格。提升广告片、特效制作效率，降低90%成本。立即了解，实现高质量视频创作。
豆包大模型-字节跳动推出的系列大语言模型

豆包大模型：字节跳动研发的多模态AI工具，支持128K长文本处理及方言语音识别，适配企业成本敏感型业务，通过国家信息安全等级保护三级认证，Lite版成本为行业平均1/3。
AnimateDiff-Lightning：字节发布的快速生成视频的AI模型

⚡ AnimateDiff-Lightning是什么？ AnimateDiff-Lightning是字节跳动2025年重磅升级的 AI视频生成闪电侠，核心黑科技是 “渐进式对抗扩散蒸馏” ——把传统几十步的视频生成压缩到 4-8步搞定！1080P高清视频最快 11秒出片，还能无缝兼容赛博朋克、水墨国风等 200+艺术风格，连头发丝飘动都自然到以假乱真，彻底告别“PPT式动画”黑历史！官网入口：立…
语鲸大模型-深言科技推出的开源中英双语大语言模型

🐳 语鲸大模型：专为中文优化的智能助手想让AI真正理解中文的微妙之处吗？语鲸大模型（LingoWhale-8B）就是这样一个专为中文场景深度优化的大语言模型。由深言科技研发的这款开源模型，拥有80亿参数，基于数万亿高质量中英数据训练而成，特别擅长处理长文本和复杂中文语义理解，堪称中文AI助手的最佳选择。 GitHub：https://github.com/DeepLangAI/LingoWhal…