-
文心大模型4.5:百度推出的新一代原生多模态基础大模型
AI不理解中文梗?百度文心大模型4.5:深度掌握中国文化语境,支持图文音视频多模态处理,企业级安全防护。中文理解准确率超竞品,立即体验最懂中文的AI助手。 -
千帆大模型平台-百度推出的大模型与AI应用开发服务平台
文心千帆:企业级大模型服务平台 文心千帆是百度智能云推出的一站式企业级大模型生产平台,整合文心一言等百度自研大模型及开发工具链,支持企业定制专属AI模型,覆盖智能问答、内容创作、数字人直播等场景,助力千行百业实现智能化升级。 官网链接:访问文心千帆平台 核心功能 全流程模型开发 智能推理:直接调用文心大模型,支持实时生成PPT、旅游规划、直播话术等高复杂度任务。 模型微调:企业通过少量精标数据(最… -
Hailuo 02:MiniMax最新推出的AI视频生成模型
🌊 Hailuo 02:一键生成高清视频的AI魔法师 Hailuo 02(海螺02)是上海人工智能企业MiniMax(稀宇科技)在2025年6月18日推出的新一代AI视频生成模型,被誉为"全球首个能生成体操等高度复杂场景的视频大模型"。它不仅能根据文字描述生成1080P高清视频,还能处理极端复杂的物理场景,让普通人也能轻松制作专业级视频内容,真正实现了"人人都是导演&… -
京东言犀大模型
京东言犀大模型:产业智能化的新引擎 京东言犀大模型深度融合供应链与产业场景,专为零售、物流、金融等高知识密度领域打造。2025年升级至720B参数规模,新增多模态理解能力,强化对长文本、复杂逻辑任务的支撑,成为国内首个通过工信部“可信AI”认证的产业大模型。 官网直达:https://yanxi.jd.com 一、技术架构:全栈工具链支撑 1. 数据融合引擎 供应链知识增强:30%独家数据来自京东… -
百度正式开源文心4.5系列模型
🚀 文心4.5重磅开源:百度10款大模型免费开放 2025年6月30日,百度正式宣布全面开源其文心一言4.5系列大模型,一次性释放了10款不同规格的模型,涵盖了从470亿参数到3亿参数的混合专家(MoE)模型,以及一个轻量级的3亿参数稠密模型。这次开源不仅包含了预训练权重,还提供了完整的推理代码,开发者可以轻松地在Hugging Face、GitHub以及飞桨星河社区获取这些资源,真正实现了“拿来… -
-
-
昆仑万维-天工AI大模型
开篇:国产AI大模型的新势力 想用AI辅助工作学习但担心国外工具不好用?天工AI作为昆仑万维推出的国产大语言模型,提供了更懂中文的智能服务。这款工具支持文本生成、代码编写、多模态交互等多种功能,旨在为用户提供一站式AI解决方案。 官网链接:https://www.tiangong.cn/ 🚀 产品定位与核心价值 天工AI的突出特点是双千亿级参数架构,在保持强大能力的同时优化了成本效率。它不仅能够处… -
Step-3:阶跃星辰推出的千亿参数多模态大模型
开篇:国产大模型的新突破 AI大模型领域又添新成员。Step-3是阶跃星辰推出的千亿参数多模态大模型,能同时处理文字、图片、视频等多种信息。这款国产AI在逻辑推理和长文本处理方面表现突出,旨在推动各行业智能化升级。 官网链接:https://platform.stepfun.com 🚀 产品定位与核心价值 Step-3不是单一功能的AI工具。它集成了理解、分析、创作等多种能力,像一个全能的智能助手… -
通义万相Wan2.2- 阿里推出的开源视频生成大模型
🎬 视频制作迎来"自动驾驶"时代!这个AI模型让好莱坞级特效触手可及 做视频最头疼什么?特效制作绝对排第一。阿里推出的通义万相Wan2.2正在改变这个现状,这个开源视频生成大模型能让普通人也能做出专业级视频。只需要输入文字或图片,它就能生成物理效果逼真、电影质感十足的视频内容,最关键的是完全开源免费,让每个人都能享受视频创作的乐趣。 在线体验:https://tongyi.al… -
GitAgent-面壁智能联合清华大学发布的大模型智能体应用框架
🔍 GitAgent 框架:大模型智能体的工具箱革命 GitAgent 是由面壁智能与清华大学自然语言处理实验室联合研发的创新型框架,旨在解决大模型智能体在复杂任务中的工具扩展瓶颈。其核心突破在于赋予智能体自主从 GitHub 挖掘、配置并应用工具的能力,通过四阶段流程动态扩展工具箱,显著提升任务解决效率。 🔧 四阶段工具箱扩展流程 智能搜索阶段系统基于用户需求,在 GitHub 海量仓库中精准筛… -
灵医Bot:百度旗下医疗健康AI大模型
灵医Bot:百度推出的AI健康助手,能看病吗? 灵医Bot是百度“灵医智惠”品牌推出的医疗健康大模型,它基于百度的文心大模型技术,并学习了全国800多家医院和4000多家基层医疗机构的真实诊疗经验。这款AI工具主要为医生和医疗机构提供临床辅助、患者服务和医疗管理等方面的智能支持,旨在提升医疗效率和质量,但它不能替代医生进行诊断。 产品入口:https://01.baidu.com 🩺 核心功能:它… -
Ovis-U1:阿里巴巴推出的统一的多模态理解与生成模型
🎨 Ovis-U1:能看懂会创作的AI多面手 Ovis-U1是阿里巴巴国际AI团队在2025年6月底推出的统一多模态大模型,虽然只有30亿参数,却同时具备了图像理解、文字生成图像和图像编辑三大核心能力。它就像一个真正的"AI全才",既能准确描述图片内容,又能根据文字描述创作精美图像,还能按照指令精准修改现有图片,打破了传统AI模型"专精一门"的局限。 访问O… -
混元DiT-腾讯最新开源的文生图AI模型
混元DiT:腾讯最新开源的文生图AI模型,让AI绘画更简单 混元DiT是腾讯推出的开源文生图模型,基于扩散变换器架构开发,能够根据文字描述快速生成高质量图像。这个模型支持中英文提示词,在人物生成、场景构建等方面表现出色,为开发者和创作者提供了一个强大且易用的AI绘画工具。 官网链接:https://hunyuan.tencent.com/ ✨ 核心功能亮点 高质量图像生成:输入文字描述即可生成细节… -
CogView4 – 智谱推出的开源文生图模型,让文字秒变高清大图
不会设计也能做海报?智谱CogView4开源文生图模型:精准生成汉字,免费商用,支持中英文双语描述与任意分辨率输出。立即了解,轻松生成高清海报/插画/配图。 -
-
HunyuanCustom:腾讯混元开源的多模态定制化视频生成工具
视频制作不用摄像机?腾讯混元HunyuanCustom:AI视频生成工具,输入文本/图片即可生成4K视频,解决身份漂移难题,保真度达92%。电商与教育创作者必备,提升10倍制作效率,立即体验高效视频创作。 -
讯飞星火语音大模型:语音AI让你告别打字烦恼
🎙️ 说话就能控制一切!这个语音AI让你告别打字烦恼 还在为语音助手识别不准、反应慢而头疼?科大讯飞的星火语音大模型正在重新定义人机交互。这个支持37种语言无缝切换的语音平台,不仅能准确识别混合语言输入,还能合成超拟人化的语音输出,让机器听起来更像真人。从智能客服到教育学习,它正在让语音交互变得前所未有的自然流畅。 产品官网:https://xinghuo.xfyun.cn/speechllm 核… -
GO-1:智元推出的首个通用具身基座模型
机器人看视频学技能?GO-1大模型通过观看人类视频让机器人快速掌握复杂操作,小样本泛化降低90%训练成本,一脑多形适配多种硬件。提升部署效率,立即了解突破性进展。 -
Qwen VLo – 阿里推出的多模态统一理解与生成模型
🔍 Qwen VLo:从“看懂”图片到“创作”图片的AI多面手 Qwen VLo是阿里云通义千问团队在2025年6月推出的一款多模态生成式AI模型。它不仅能够像传统视觉模型那样“理解”图像内容,还能根据用户的自然语言指令进行高质量的图像生成与编辑,真正实现了从“感知”世界到“描绘”世界的跨越。这款模型支持图像生成、编辑、风格转换、视觉定位等多种任务,尤其擅长处理开放式的创作指令。 你可以通过Qwe… -
360智脑
360智脑是什么?360智脑是由中国科技公司360集团开发的人工智能平台,专注于推动人机协作创新,激发用户创造力。该平台整合了多种AI技术,提供开放接口和工具集,支持开发者和企业用户构建智能应用。 360智脑官网 360智脑可以做什么?平台提供一系列AI驱动工具: API开放平台:允许开发者接入AI能力,开发定制应用。 360鸿图:AI作图工具,辅助数据可视化和创意设计。 360AI搜索:智能搜索… -
Audiobox-Meta推出的新一代音频生成模型
Meta Audiobox是什么? Meta推出的新一代AI音频生成工具,用声音+文字指令就能定制各类音效、人声和环境音。比如录一段自己说话,输入“变成新闻主播腔调,背景加入雨声”,就能生成带场景的播报音频。2025年新增中文支持,个人创作者和影视团队都在用。 https://ai.meta.com/audiobox 核心功能:声音自由定制 1. 语音克隆+风格迁移 上传10秒人声样本→生成相同音… -
gpt-realtime – OpenAI最新推出的语音模型
OpenAI GPT-Realtime语音AI:实现自然实时对话,支持情感识别和多语言无缝切换。提升智能客服与语言学习体验,立即了解革命性语音技术。 -
























