-
协和·太初 – 北京协和医院和中科院联合推出的罕见病领域 AI 大模型,让生命不再被漏诊
罕见病诊断难?协和太初AI诊断系统:精准识别412种罕见病,准确率达92.7%,降低误诊率41%,缩短确诊周期2.8年。基层医院与患者必备,立即了解权威诊断方案。 -
GLM-Realtime:智谱最新推出的端到端AI模型,支持2分钟记忆和清唱功能
GLM-Realtime:智谱AI端到端多模态模型,支持清唱与毫秒级响应,适配智能硬件/教育/医疗场景,经评测响应速度领先,提升实时交互体验。 -
Ferret-UI:苹果公司推出的多模态AI模型
🔍 专攻手机界面的“视觉大脑” 苹果自研的多模态交互引擎Ferret-UI是苹果专为移动端打造的AI模型,能像人类一样“看懂”手机屏幕。它不仅能识别App图标、按钮等微小元素,还能根据用户指令自动操作界面——比如一句“订美团外卖”,它就能跳转应用完成下单,彻底告别手动点按。 官网直达:https://arxiv.org/pdf/2404.05719.pdf开发者社区:https://discord… -
Mora-微软等推出的多智能体视频生成框架
微软开源Mora视频AI实测:多智能体框架支持文生视频/图生视频/视频编辑等6大任务,性能接近Sora且完全免费!附2025年与Runway/Pika/Stable Video全系竞品对比表,立即获取开源替代方案。 -
Qwen VLo – 阿里推出的多模态统一理解与生成模型
🔍 Qwen VLo:从“看懂”图片到“创作”图片的AI多面手 Qwen VLo是阿里云通义千问团队在2025年6月推出的一款多模态生成式AI模型。它不仅能够像传统视觉模型那样“理解”图像内容,还能根据用户的自然语言指令进行高质量的图像生成与编辑,真正实现了从“感知”世界到“描绘”世界的跨越。这款模型支持图像生成、编辑、风格转换、视觉定位等多种任务,尤其擅长处理开放式的创作指令。 你可以通过Qwe… -
LivePhoto:图片生成动态视频模型
🎬 想让照片动起来?LivePhoto让静态图片秒变动态视频 LivePhoto是一款由阿里巴巴、香港大学和蚂蚁集团联合研发的图片转视频AI模型,基于先进的Stable Diffusion架构,创新性地融合了运动控制技术。它能够将静态图像转换为生动的动态视频,用户只需通过文字指令就能精准控制画面中元素的运动,让照片真正"活"起来。 官网链接:https://xavierchen… -
华为-盘古AI大模型
华为盘古大模型系列已全面上线,包含自然语言处理(NLP)、计算机视觉(CV)及气象科学计算三大核心模型,推动AI技术在各行业落地应用。该系列通过千亿级参数规模与深度学习方法,显著提升中文理解、图像分析和气象预测能力。官网链接:华为云盘古大模型官网 一、核心模型与技术亮点 NLP大模型 能力:业界最接近人类中文理解水平的AI模型,支持文本生成、分类、问答等任务。 创新点:采用Encoder-Deco… -
-
Gemma 3-谷歌发布的开源AI模型,小尺寸可商用
Gemma 3:谷歌开源多模态AI模型,支持128K长文本处理,适配PC/移动端,经LMArena评测STEM准确率提升35%,适合科研与多语言场景。 -
昆仑大模型:中国石油等联合发布的能源行业大模型
昆仑大模型是什么? 专为能源行业打造的大型AI系统,由中国石油、中国移动、华为和科大讯飞联合研发。它像“能源行业超级大脑”,能处理地质勘探、设备管理、客户营销等专业任务,推动油田、炼化等场景的智能化升级。 官网:https://www.kunlunai.com 🔧 核心能力拆解 分层架构精准适配 专业层:地震解释、测井分析等垂直模型,直接服务地质工程师(如自动解析地下岩层数据) 行业层:油气知识库… -
dots.llm1:小红书开源的 MoE 架构大语言模型
✨ dots.llm1:小红书出品的高效AI语言模型 dots.llm1是小红书旗下人文智能实验室(hi lab) 在2025年6月开源的一款大型语言模型。它采用了先进的MoE(混合专家)架构,虽然模型总参数量高达1420亿,但在实际推理时每次只激活140亿参数。这种设计让它既能保持强大的性能,又显著降低了计算成本和响应时间,是一个非常“聪明”且“经济”的AI模型。 它基于11.2万亿高质量的真实… -
Seedance 2.0:字节跳动多模态AI视频大模型功能解析
Seedance 2.0是多模态AI视频生成模型,适配影视制作场景。支持原声音画一体与导演模式,输出15秒高质量短片,降低预演试错成本,提升商业内容生产效率。 -
B站推出bilibili index大模型,为“搜索AI助手”功能提供技术支持
🔥 B站放大招!bilibili index大模型+搜索AI助手内测,Z世代狂欢新玩具 哔哩哔哩重磅推出自研bilibili index大模型,首秀搭载 「搜索AI助手」 功能,专治“关键词搜不到”“弹幕问不出”的痛点!现在搜“如何用Pr剪出电影感vlog?”,AI直接甩你分镜头脚本+调色参数+对应宝藏UP主教程,追新番查攻略效率翻倍~ 点我抢内测资格 💡 三招解锁次世代搜索 弹幕级精准:输入“?… -
Step1X-3D:阶跃星辰开源的3D大模型,支持生成高保真可控的3D内容
不会3D建模?用嘴「说」出一个3D模型!这款国产AI工具让创作像说话一样简单 想为游戏设计一个角色却不会建模?需要产品原型但被复杂软件劝退?Step1X-3D的出现,彻底降低了3D创作的门槛。这是阶跃星辰在2025年推出的开源3D生成大模型,只需输入文字描述,几分钟内就能获得高质量3D模型,让每个人都能成为3D创作者。 官网地址:https://github.com/stepfun-ai/Step… -
k0-math:月之暗面推出的新一代数学推理模型
🧠 k0-math:月之暗面推出的数学AI,解题能力超乎想象 k0-math是月之暗面(Moonshot AI)公司推出的一个专攻数学推理的新一代AI模型。它不像普通的聊天AI,而是更像一个专门的“数学大脑”,背后用上了全新的强化学习和思维链推理技术,专门模拟人脑在解数学题时一步步思考、甚至解完还会“检查一遍”的反思过程。这就让它处理复杂数学难题的能力大幅提升,不管是考试题还是竞赛题,都能帮你搞定… -
Qwen2-Audio:阿里推出的开源音频语言大模型
Qwen2-Audio是什么? 阿里通义开源的智能音频大模型,能直接“听懂”人声、音乐、环境音,并给出文字回答或分析报告。比如你说一段话,它能帮你总结重点;录一段雨声,它能判断是否伴随雷电。无需文字转写,跨语言交流也支持。 Qwen2-Audio团队在 Hugging Face 和 ModelScope 上开源了 Qwen2-Audio-7B 以及 Qwen2-Audio-7B-Instruct,… -
Step-Audio:阶跃星辰推出的开源语音交互模型
🔊 中文语音天花板,开口就是戏精 吉利联手阶跃星辰打造的开源神器Step-Audio是国内首个能同时处理方言、歌声、情感语调的语音大模型。无论是给游戏角色配音,还是让智能客服说话带温度,它都能搞定,连东北话、四川话都学得惟妙惟肖,堪称声音界的“百变星君”。 官网直达:Step-Audio开源主页 🎭 五大核心能力,开口就惊艳 方言歌声全能王支持20+种方言(粤语、川渝话等)、中英日韩多语种切换,甚… -
LaVie:上海人工智能实验室开源的视频生成模型
小白秒变特效师?这款国产黑科技彻底杀疯了 还在为视频制作头疼?剪辑复杂、渲染太慢、特效不会做?试试清华系团队打造的LaVie——输入文字直接生成4K电影级视频,抖音百万播放量有手就能做! >> 官方免费体验:LaVie开源项目地址 2025新版LaVie强在哪? 打字出电影:输入“赛博朋克少女雨中战斗”,30秒生成10秒高清视频 照片变动画:上传静态图自动生成动态场景(如让风景照云流动… -
LongCat-Flash-Chat:美团推出的开源大语言模型
美团开源LongCat大模型:5600亿参数MoE架构,支持128K上下文和智能体任务,免费商用。性能媲美Claude4,适合开发者和企业高效AI应用。立即体验开源模型优势。 -
MovieLLM-通过AI生成电影来增强长视频理解的框架
MovieLLM是什么? 复旦与腾讯联合研发的AI电影引擎,专攻复杂剧情视频理解。它能生成风格统一的长视频,解决影视行业高质量训练数据稀缺的痛点。2025年开源版本已支持8K超清生成。 https://movie-llm.fudan.edu.cn 核心技术解析 1. 剧本智能生成 输入题材关键词(如“赛博朋克爱情”),GPT-4自动输出分镜剧本+角色对话,含场景细节描述与情绪标注。 2. 画风锁定… -
Gemini 2.5 Flash Image – 谷歌推出的AI图像生成和编辑模型
💫 Gemini 2.5 Flash:一句话生成图片的AI画师 Gemini 2.5 Flash是谷歌推出的AI图像生成与编辑工具,只需用文字描述就能创建和修改图片。无论是给照片换个背景,还是将脑海中的创意变成视觉现实,这个代号"Nano Banana"的AI模型都能快速搞定,让每个人都能轻松成为数字艺术家。 在线体验:进入 Google AI Studio,选择图像编辑即可使… -
Gemini 3 – 谷歌推出的新一代多模态理解与推理AI模型
Gemini 3:谷歌的“全能型”AI助手来了 谷歌最新推出了Gemini 3多模态AI模型,这款被誉为“全能型选手”的人工智能不仅能理解文字,还能看懂图片、视频,甚至能像真人一样进行复杂推理。它已经在多个专业测试中刷新记录,成为目前最强大的AI模型之一。无论是学习新知识、辅助编程,还是处理日常工作,Gemini 3都能提供智能帮助。 官网链接:https://deepmind.google/mo… -
Octopus V2-斯坦福推出的可在设备上运行的大模型
端侧AI新标杆:Octopus v2模型深度解析 ——手机能跑的大模型,比GPT-4更快更准 ⚙️ 核心功能亮点 1. 性能碾压主流模型 推理速度:在安卓设备上,单次函数调用响应仅需1.1-1.7秒,比云端GPT-4快168%,比“Llama7B+RAG方案”快36倍。 准确率:函数调用精准度达99.5%,超越GPT-4和RAG方案31%。 能效优化:上下文长度减少95%,相同电量下支持37倍更多… -
子曰大模型-网易有道发布的教育大模型
🚀 网易有道“子曰”:你的全能AI学习伴侣 学习遇到难题没人问?口语练习找不到陪练?别急,网易有道的“子曰”教育大模型可能就是你的救星!它可不是一个冷冰冰的AI,而是一个专为教育场景打造的垂直大模型,就像一个藏在手机里的全能家教,从翻译、作文到口语、答疑,样样都能帮上手。它的名字取自教育家孔子“因材施教”的理念,寓意着用AI技术为每个孩子提供个性化的学习支持。 官网地址:https://ziyue…
























