国内外AI产品推荐榜（2025.5）

AI产品推荐榜（2025.5）

照例，继续给大家更新本月的AI产品推荐榜。

所谓推荐，即代表可以直接上手使用，而非期货、内测版本。

本期推荐榜，涉及AI Chatbot、DeepResearch、API推荐、世界模型、AI绘图、AI视频、AI搜索、AI音乐、AI社交、电脑AI、AI会议、AI写作、AI编程、Agent编排、通用Agent、数字人、AI 3D、AI Audio、AI办公、AI浏览器、AI翻译、AI导航网站、AIGC检测、AI财经、AI医疗、AI PPT等26个场景，国内外共140款AI。

推荐榜，分为国内、国外版。国内版，直接使用，免费为主（部分收费）。国外版，大部分需要魔法，付费为主。

阅读提示：

1）加粗，为重点推荐产品。

2）标红，为新产品（含新功能）。

入榜新AI

本月入榜新AI产品（含新功能），以全新模型、全新技术为主。进入新一年，AI技术迎来全新的变化，带来了很多新的惊喜。以下是详细情况。

1、Qwen3

4月29日，阿里发布Qwen3，并开源包括旗舰模型Qwen3-235B-A22B（参数235B，激活参数22B）在内的8款不同尺寸模型，带来了国内首款混合推理模型。

我们整理了10+提示词，帮你深度解锁Qwen3。

2、DeepSeek-Prover-V2-671B

4月30日，DeepSeek开源了新模型DeepSeek-Prover-V2-671B，这是一个专门解决数学问题的专家模型。模型性能非常强大，就连7B模型都秒杀了很多模型。

Huggingface开源网址：

https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B

3、豆包“超能创意”

4月26日，豆包灰度内测“豆包CreationAgent v1.0 Beta”（正式上线版改为“超能创意”），可用嘴改图，一次性生成多达20张图片，特别擅长分镜和绘本制作，而且还保持了超强的一致性（见测评文）。

体验地址：https://www.doubao.com

4、Step1X-Edit

4月26日，阶跃星辰发布并开源图像编辑模型Step1X-Edit，性能达到SOTA级。Step1X-Edit不只能“改图”，更能“听得懂、改得准、保得住”。

Github：

https://github.com/stepfun-ai/Step1X-Edit

HuggingFace：

https://huggingface.co/stepfun-ai/Step1X-Edit

体验网址（阶跃新官网）：stepfun.com

5、心响APP

4月22日，百度推出通用智能体心响APP，可通过自主规划与多智能体协作，一站式解决用户复杂问题。目前，仅支持安卓版体验。

6、Vidu Q1

4月22日，生数科技发布Vidu Q1模型，在VBench Leaderboard榜单上登顶，超越Runway 、Sora、LumaAI等视频模型，拿下文生视频赛道榜单双第一。

体验地址：Vidu.cn

7、飞猪「AI问一问」

4月21日，飞猪旅行推出“AI问一问”功能。结合飞猪的行业数据和大模型的深度研究能力，大幅降低AI幻觉问题。通过多专家模型协作工作，为用户提供真实、可靠的旅游攻略。

体验方式：飞猪F5及以上会员。

8、扣子空间

4月18日，扣子内测通用智能体「扣子空间」。它是类似Manus、Genspark的通用Agent，只需要大白话命令，即可完成各种复杂任务，与多Agent协作工作，还支持MCP。目前正在内测，免费使用（见测评文）。

体验地址：https://space.coze.cn

9、微信「元宝」

4月16日，微信上线AI助手「元宝」。「元宝」能联网搜索、查天气、总结文章/链接、识别图片、总结文件、总结B站/抖音，并且支持语音对话。

10、Z.ai

4月15日，智谱一口气开源了基座、推理、沉思6款模型（详细介绍）。

同时，启用了全新的全球域名Z.ai，支持3款模型：GLM-4-32B、Z1-32B和Z1-Rumination-32B，基座、推理、沉思，该Z.ai的，都Z.ai。

体验地址：Z.ai

11、可灵2.0

4月15日，快手发布可灵2.0模型，在运镜、动作稳定性、物理交互和语义理解上有大幅提升。不过，价格非常昂贵，新模型也被戏称为“可贵”，一支5s视频成本10元。

体验地址：https://app.klingai.com

12、Seed-Thinking-v1.5

4月14日，字节跳动Seed团队发布最新的思考模型Seed-Thinking-v1.5，在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出，模型采用MoE架构，总参数200B。

目前，仅支持火山引擎API接口调用。预计不久，将全量上线豆包。

技术报告链接：https://github.com/ByteDance-Seed/Seed-Thinking-v1.5

13、即梦3.0

4月3日，即梦推出图片3.0模型，在语义理解、小字稳定性、画面构图与排版以及美感方面有大幅提升，能够直出各种海报（见测评文）。

在模型竞技场上，丝毫不逊GPT-4o、Imagen 3、Midjourney v6.1、FLUX 1.1 Pro、Ideogram 3.0等文生图模型。

体验地址：https://jimeng.jianying.com

14、Genspark

4月3日，前百度高管创办的Genspark推出通用智能体Genspark Super Agent，集成AI搜索、浏览器和强大智能代理功能，能自主思考、规划和执行各种任务，如旅行计划、视频内容生成、数据可视化以及打电话等。

体验地址：https://www.genspark.ai

15、小白研报

4月，问小白推出DeepResearch功能「小白研报」。小白研报特别擅长解答复杂问题（见测评文），如财报分析、学术/商业研究以及生活场景里复杂的策略规划等。

思考步骤长达30+轮，可浏览上百个网页，并生成一个专业、结构清晰以及可视化图表的长文报告（平均可达2W字）。

体验地址：https://www.wenxiaobai.com

16、AutoGLM沉思

3月31日，智谱发布全球首款集深度研究和操作执行于一体的自主智能体「AutoGLM沉思」。

「AutoGLM沉思」不仅具备DeepResearch的能力，还拥有动手能力。它可以像人一样自主浏览和操作网页，可以一边进行复杂思考，一边执行任务操作（见测评文）。

体验路径：前往智谱清言官网，下载智谱清言PC版，在智能体中心搜【AutoGLM沉思】。

17、MiniMax Audio

3月31日，MiniMax Audio推出Speech-02系列语音模型（见测评文），支持全球30+语种，一次性可输入20万字符，合成语音自然，大幅度解决了此前TTS存在的停顿、语调变化、情感表达等问题，人声相似度达到99%。

比如，这是模仿林志玲的声音，非常相似。

体验地址（需要魔法）：

https://www.minimax.io/audio

18、Qwen2.5-Omni

3月27日，阿里开源全模态模型Qwen2.5-Omni-7B（见测评文），在多模态基准上刷新世界纪录，在seed-tts-eval语音生成基准上媲美人类水平。

Hugging Face：

https://huggingface.co/Qwen/Qwen2.5-Omni-7B

19、豆包「深度思考」

3月27日，豆包上线DeeperSearch功能「深度思考」（见测评文）。面对复杂问题，豆包会先推理，再搜索，支持边搜边想。

体验地址：www.doubao.com

20、Mureka O1

3月26日，昆仑万维推出全球首款音乐推理模型Mureka O1和Mureka V6，听感评测超过Suno V4（见测评文）。

我也用Mureka O1写了首歌，欢迎大家来听。

体验地址：www.mureka.ai

21、DeepSeek-V3-0324

3月25日，DeepSeek V3基座模型进行“小版本”更新，参数685B，在代码能力上有显著提升（见测评文），支持MIT许可开源。

新模型上线DeepSeek官网，支持HTML代码预览。

22、混元T1

3月21日，腾讯混元发布T1正式版，更快、更好。更快，首字秒出，吐字速度60-80tokens/s；更好，多项指标处于世界顶级水平（前五）。

T1正式版体验入口：

https://llm.hunyuan.tencent.com/#/chat/hy-t1

23、秒哒

3月24日，百度“秒哒”正式全量上线，带来国内首个“对话式”应用开发平台。平台采用”无代码编程+多智能体协作+多工具调用”技术组合，用户仅需通过自然语言描述需求，可自动生成完整功能代码。

体验链接：

https://cloud.baidu.com/product-s/miaoda_home

24、Hunyuan3D 2.5

3月18日，腾讯混元一口气开源了5款3D生成模型。

新模型带来多视图输入（几张不同视角的照片就能合成3D）、智能减面（自动给模型瘦身）、PBR材质升级（质感更细腻、更逼真）以及多格式兼容四大功能，可帮助大家轻松、专业地玩转3D世界。

4月23日，腾讯混元3D模型升级至2.5版，建模精细度上大幅提升，分辨率提升至1024，参数量也从1B提升至10B。

混元3D体验网址：

https://3d.hunyuan.tencent.com

Huggingface开源社区：

https://huggingface.co/spaces/tencent/Hunyuan3D-2mv

Github代码库：

https://github.com/Tencent/Hunyuan3D-2

25、文心4.5和X1

3月17日，文心大模型4.5如期上线。同时，百度还意外地带来了自家的推理模型文心X1。新模型全部免费，多模态理解能力优秀，理解、生成、逻辑、记忆能力全面提升（见测评文）。

一个月后的4月25日，百度相继发布了2个模型的Turbo版，速度更快，性能更强，价格更便宜。

体验地址：https://yiyan.baidu.com

26、夸克「AI超级框」

3月13日，阿里推出AI旗舰应用——新夸克。全新夸克基于Qwen领先的推理及多模态大模型，全面升级为无边界的“AI超级框”。

与对话式AI不同，夸克将AI对话、深度思考、深度搜索、深度研究、深度执行整合到一个极简“AI超级框”内，一站式满足用户需求。

4月27日，夸克AI超级框发布全新AI相机，拍照问夸克，啥都能答，啥都会答。

27、Manus

3月6日，蝴蝶效应发布全球首款通用智能体Manus。这是一个划时代的产品，自此以后各种“通用智能体”如雨后春笋般冒了出来。

不同于常规AI工作流，Manus真正实现了从目标设定到成果交付的全链路自主执行，完全媲美人类专家：通过多智能体协同架构，它能自主分解任务、调用工具链，甚至实时修正执行路径。

体验地址：https://manus.im

28、QwQ-32B

3月6日，阿里推出QwQ-32B推理模型，32B的小参数实现了R1 671B的效果。时至今日，QwQ-32B依然能打，常在各大基准扮演对标模型。

体验地址：https://chat.qwen.ai

29、Trae

3月3日，字节发布国内首款AI原生IDE——Trae国内版，集成豆包1.5Pro和满血版DeepSeek R1、V3模型。

4月23日，Trae进行了大更新（见测评文），支持MCP、自定义智能体、自定义AI规则以及上下文能力增强。能力已与Cursor看齐，甚至中文体验更胜一筹。

体验地址：https://sourl.cn/6SQGmz

30、PixVerse V4

2月24日，爱诗科技发布PixVerse V4模型，新增音效、对口型、多种视频风格实时重绘等功能，最关键是生成速度大幅提升，最快5s出片。

体验地址：https://app.pixverse.ai

31、o3、o4mini

4月17日，OAI推出新一代推理模型o3和o4mini。o3模型，首次将图片推理融入CoT思维链中。在多项基准测试中，o3名列前茅，算是目前性能最强的推理模型。

图自赛博禅心

o4mini，可以理解为是OAI性价比最高的推理模型，部分场景超过o3，便宜又快，适合跑量任务。

32、GPT-4.1

4月15日，OAI推出新模型GPT-4.1，在代码、指令遵循和上下文方面有显著提升，支持最高100万token的上下文。同时，把自家的GPT-4.5淘汰了。

OAI表示，4.1系列是API专供，主打性价比。Btw，OAI他们家的命名，是真够乱的。

33、A2A协议

4月10日，谷歌开源发布首个智能体交互协议A2A（Agent to Agent Protocol），可以让不同框架和模型编排的智能体相互协作。

GitHub仓库：

https://github.com/google/A2A

34、Claude也能Research了

4月16日，Anthropic推出两个重磅新功能：Research以及与Google Workspace集成。

Research功能可快速检索网络与内部文件，精准回答复杂问题；Google Workspace集成则让用户能无缝调用Gmail、日历和文档信息，轻松完成任务。

35、Midjourney V7

4月4日，Midjourney正式推出V7模型，在人体、手部和各类物体的细节呈现上更加连贯自然。同时，Midjourney推出了草稿模式，大幅提升速度的同时，降低使用成本。

体验地址：

www.midjourney.com

36、Gen4

4月1日，在举例上代模型接近1年后，Runway最新视频模型Gen4姗姗来迟。Gen4重点提升了一致性、物理遵循和图生视频能力。

体验地址：https://app.runwayml.com

37、ideogram 3.0

3月26日，Ideogram正式推出3.0版本，在画质、光影细节、语义理解、文本生成和风格控制上都有进一步提升。

体验地址：https://about.ideogram.ai/3.0

38、Gemini 2.5 Pro

3月26日，谷歌发布Gemini 2.5 Pro，在多项基准测试中全面超越OpenAI o3-mini，Claude 3.7 Sonnet、Grok-3和DeepSeek-R1。

Gemini 2.5 Pro编程能力优秀，可一句话生成各种高级感满满的可视化图表。

体验链接：

https://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25

39、ChatGPT-4o生图

3月26日，ChatGPT-4o上线本应于1年前上线的生图能力。因采用自回归模型，4o在生图能力上断层级领先，对语义理解高度遵循，其吉卜力风格被全网刷屏（见测评文）。

40、Gemini 2.0 Flash

3月14日，谷歌推出Gemini 2.0 Flash多模态模型，可以用嘴改图，比如换装、换包装、换场景以及生成连续性图片（比如菜谱、绘本、分镜），主体一致性保持较好。

体验地址：

https://developers.googleblog.com/en/experiment-with-gemini-20-flash-native-image-generation/

41、Claude 3.7 Sonnet

2月25日，Anthropic公司发布Claude 3.7 Sonnet模型，这是一款兼具“标准模式”和“推理思考模式”的混合推理模型。模型在数学、物理和编程等任务上表现优秀，特别是代码能力上遥遥领先。

体验链接：Claude.ai

42、Grok3

2月18日，xAI推出新一代AI模型Grok3，被马斯克称为“地球上最聪明的人工智能”。Grok3引入了CoT推理能力，并推出DeepSearch和DeeperSearch深度研究功能，

体验地址：https://x.ai/grok

国内AI推荐

1、AI Chatbot

主要推荐：

1）DeepSeek。基础模型更新至V3-0324后，中文能力、代码能力显著增强，全球第一梯队水平，国内前三。

体验路径：https://chat.deepseek.com

2）豆包。依托字节资源，豆包用户疯狂增长，APP下载量和月活排全国第一。豆包上有很多比较实用的功能，特别适合新手使用。

体验网址：https://www.doubao.com

3）Qwen Chat。新上线千问3模型，带来了国内首款混合推理模型，支持MCP和工具调用，综合性能国内前三，世界前五。

体验地址：https://chat.qwen.ai

2、API部署模型及平台

主要推荐：

1）Qwen。全球开源模型最多的模型厂商，当之无愧源神地位。API价格亲民，在阿里云百炼即可调用。

API调用地址：https://bailian.console.aliyun.com

2）Deepseek。国产之光，性能直追OpenAI。API价格亲民，常被称作AI届拼多多。

API开放平台：https://api-docs.deepseek.com/zh-cn

3）GLM。智谱一直走在开源的路上，先后开源了多个模型。比如其最新的GLM基座、推理和沉思模型，全部开源。

智谱开放平台：https://bigmodel.cn/

3、DeepResearch

主要推荐：

1）ChatGPT的DeepResearch。基座模型来自o3，是目前最强的DR（DeepResearch）功能。

体验地址：https://chatgpt.com

2）智谱沉思。分别有网页版沉思和AutoGLM沉思（computer use），底模、沉思、推理模型强大，国内深度研究功能的天花板。

体验地址：https://chatglm.cn/

3）小白研报。可展开数十轮深度搜索，能搜索上百个网页，提供深度研究报告（平均2万字），生成可视化页面。

体验地址：https://www.wenxiaobai.com

4）飞猪「问一问」。这是行业数据与大模型结合最好的产品，大幅解决幻觉问题。所有做垂类产品的小伙伴，都建议来体验下飞猪「问一问」。

4、AI绘图

主要推荐：

1）Whee。Whee是美图推出的AI素材生成器，支持文生图和图生图。提供AI改图、风格模型训练、AI修复、AI扩图、AI消除、AI模特图以及提示词库训练等丰富功能。

体验地址：www.whee.com

2）即梦/豆包。字节出品，提供多个生图模型供用户选择。新上线的图片3.0模型，文字能力进一步升级（测评文）。

体验网址：dreamina.jianying.com

3）LiblibAI。哩布哩布是奇点星宇推出的AI绘图创作平台，支持SD图片生成、模型上传与分享、ComfyUI工作流以及LoRA训练等功能。

体验网址：www.liblib.art/

5、AI视频

主要推荐：

1）可灵2.0。4月，可灵升级至2.0版，能力依然全球T0级，就是有点贵。支持文生、图生（首尾帧）、对口型、运动笔刷、人脸模型训练、API调用等功能。

使用网址：klingai.kuaishou.com

2）海螺AI。支持文生、图生，新增参考生视频、运镜模式等功能，泛化能力强，想象力丰富（见测评文），在海外很火。

体验链接：hailuoai.com

3）万相2.1。基础模型（文生&图生）大幅升级，在语义理解、运动稳定性和细节表现方面大幅优化，支持中文字特效生成（详见测评文），全部免费且开源。

体验地址：https://tongyi.aliyun.com/wanxiang

4）即梦视频3.0。5月初，即梦视频模型升级至3.0，与图片3.0模型配合，非常便利内容创作。

体验地址：https://jimeng.jianying.com

6、AI搜索

主要推荐：

1）纳米。功能丰富，模型众多，新增知识库、本地模型部署、MCP广场、深度研究智能体等功能，都很实用。

体验地址：https://www.n.cn

2）夸克。上线超级AI框、AI相机，可解万千问题。最近，还上线了DeepSearch功能。

下载地址：www.quark.cn

3）百度“AI搜”。百度专为AI搜索打造，无广清爽界面，接入了最新的文心和DeepSeek模型，双模驱动。

体验网址：https://chat.baidu.com

4）秘塔AI搜索。接入DeepSeek模型，新增知识库、研究模式和学习平台。

体验链接：https://metaso.cn

7、AI会议

主要推荐：

1）百度网盘。听记功能，可一键整理各类音频，提供多种会议模板供用户选择。

体验地址：

https://pan.baidu.com/embed/listennote

2）通义“效率”工具。可帮助大家进行会议记录，会议音频整理，学习视频整理。

体验网址：

https://tongyi.aliyun.com/efficiency

8、AI音乐

主要推荐：Mureka。国内首款音乐推理模型，性能完全不输Suno V4，可一键生成一首歌曲和BGM（见测评文）。

体验地址：www.mureka.ai

9、AI Audio

主要推荐：MiniMax Audio。目前最强的TTS工具（见测评文），内置了300多种音色库，还可以进行声音克隆。

体验地址（需要魔法）：

https://www.minimax.io/audio

10、Agent编排工具

主要推荐：扣子。简单易用、好上手，支持豆包、Moonshot、Qwen、MiniMax、DeepSeek等模型，可发布到豆包、飞书、企微、公众号、掘金社区等平台。

使用网址：www.coze.cn

11、通用智能体

主要推荐：

1）Manus。全球首款通用智能体，底模Claude 3.7，具备强大的工具调用能力和深度搜索、深度研究能力。

体验路径（需要魔法）：manus.im

2）扣子空间。国内快速复刻Manus的通用智能体，支持MCP，擅长深度搜索和深度研究能力。

体验路径：https://space.coze.cn/

3）AutoGLM沉思。擅长深度搜索和写作，具备computer use能力。

体验路径：前往智谱清言官网，下载智谱清言PC版，在智能体中心搜【AutoGLM沉思】。

12、AI写作

主要推荐：

1）ima copilot。由腾讯推出的AI智能工作台，可搜微信公众号、B站和知识库广场，支持即时编辑、扩写、润色。

下载网址：https://ima.qq.com

2）自由画布。由百度文库&百度网盘联手打造，供用户自由创作。

支持全模态内容，无论是文档、PPT、PDF、图片、音频、视频、URL链接还是本地、云盘、公域，都可以直接拖进“自由画布”，一拖一化，进行内容创作。

体验链接：https://wenku.baidu.com/board

13、AI编程

主要推荐：Trae。由字节推出的AI IDE产品，海外版集成GPT-4.1、Claude-3.7等顶尖模型，国内版集成DeepSeek-V3-0324、豆包1.5pro等优秀模型，支持MCP。

体验链接：https://www.trae.ai

14、3D模型

主要推荐：混元3D。支持图生和文生3D，可生成各种3D模型。

体验链接：

https://3d.hunyuan.tencent.com/

15、AI浏览器

主要推荐：夸克。不仅是浏览器，还是超级AI框（APP端），新上线DeepSearch深度搜索功能。

支持一键AI搜索、写作、PPT生成、视频总结、文件总结、截屏搜、划词搜等功能。

下载链接：quark.cn

16、AI PPT

主要推荐：通义PPT、Kimi PPT助手、AiPPT、百度文库、讯飞智文。

关于AI PPT的使用攻略：我一次性给大家讲透了，特别适合小白。

17、AI财经

主要推荐：Reportify。查研报、读财报、解析财报非常方便，适合投资人士使用。

体验链接：https://reportify.cc

18、AI翻译

主要推荐：沉浸式翻译。浏览器插件方式使用，支持双语显示，降低原网页“侵入性”，支持API接入各个大模型。

体验地址：https://immersivetranslate.cn/

19、AI医疗

主要推荐：紫荆AI医生，由清华团队研发，12月刚上线42位AI医生，目前处于内测期。

体验链接：

https://www.tairex.cn/agent-hospital

论文链接：

https://arxiv.org/pdf/2405.02957v1

20、AI导航网站

主要推荐：AI工具集。汇集了市面上几乎所有的AI产品，分类清晰、产品丰富，可随时查找需要的AI。

体验网址：ai-bot.cn

21、数字人

主要推荐：剪映。剪映数字人支持对口型，可自由调节数字人的形象、音色、景别以及背景，付费。

目前，国内数字人技术整体都还不太成熟，而且很贵。

22、AIGC检测

主要推荐：朱雀大模型。支持图片和文字检测，AI检出率达到95%（详见测评文）。

体验网址：https://matrix.tencent.com/ai-detect

国外AI推荐

1、AI Chatbot

主要推荐：

1）GPT-4o、o3

2024年9月13日，OpenAI发布推理模型o1（mini、preview）；12月5日，o1满血版上线；12月21日，OpenAI发布下一代模型o3；2025年2月1日，o3-mini正式上线；4月17日，o3正式版上线，同时推出o4-mini，首次将图片推理融入CoT思维链中。

o系列模型在推理能力上显著提升，进入博士级水平，我们离AGI越来越近。

使用网址：www.chatgpt.com

2）Claude 3.7 Sonnet

作为OpenAI最强竞争对手Anthropic，2月推出Claude 3.7 Sonnet，带来了全球首款混合推理模型，综合性能非常强大。

使用路径：Claude.ai

3）Gemini 2.5 Pro。

进入2025年，谷歌非常争气，接连推出Gemini家族模型，与ChatGPT、Claude一起奠定了“御三家”（公认最强的三家模型）的排面。

体验链接：https://aistudio.google.com

2、API部署推荐

主要推荐：GPT4.1/o4-mini，性能强劲，价格亲民。新一代Llama4有点拉跨，所以不做推荐。

3、世界模型

主要推荐：李飞飞团队打造的“空间智能”模型，只需要一张图，就可以生成一个逼真的3D世界。

产品详情：

https://www.worldlabs.ai/blog

4、电脑AI

主要推荐：Copilot。

2024年9月，Copilot更新，开启Web+Work+Pages的工作流。推出Copilot Pages、办公全家桶以及Copilot智能体等产品。

5、AI绘图

主要推荐：

1）Midjourney。2025年4日，在4o影响下，Midjourney被迫升级至V7版，出图质量进一步提升。

使用网址：www.midjourney.com

2）GPT-4o。由于4o采用了自回归技术路线，生图能力和使用场景比其他模型大幅领先。

比如，可以直接做这样一张json卡片（见攻略文），其他生图模型基本都不能。

6、AI视频

主要推荐：

1）Veo 2。谷歌出品，支持文生、图生，最高4k分辨率、8s视频，在光影、镜头、运动、质感、语义遵循等方面表现优秀，超过Sora、Gen3以及luma等知名模型。

体验网址：

https://deepmind.google/technologies/veo/veo-2

2）Gen 4，2025年4月，Runway推出新模型Gen4，重点提升了一致性、物理遵循和图生视频能力。

体验网址：

https://app.runwayml.com

3）Sora。2024年12月10日，Sora正式上线。支持文生、图生以及V2V（视频生视频），最长时长20s，最高画质1080P。

体验地址：www.sora.com

4）RAY2。训练量是前身1.6模型的10倍，在语义理解、物理动作、运镜、光影、物理模拟、色彩等方面有大幅升级。

体验链接：https://lumalabs.ai/ray

7、Agent编排工具

主要推荐：

1）Coze，字节出品，依托ChatGPT，可轻松创建AI智能体。

使用网址：www.coze.com

2）GPTs，ChatGPT官方智能体创建器，可根据GPT4o/4.1/o3创建个人智能体。

8、AI搜索

主要推荐：Perplexity，新型对话式AI搜索的鼻祖，需科学上网。2月，Perplexity接入了DeepSeek R1模型。

使用网址：www.perplexity.ai

此外，Felo、New Bing、SearchGPT等产品也值得一试。比如felo，可搜小红书、Reddit等封闭平台，还支持多模型调用。

9、数字人

主要推荐：HeyGen，收费，49~150美刀/月。用户只需输入脚本，即可在几分钟内生成用于营销、沟通、销售、学习等的视频。

HeyGen支持使用AI语音和口型同步为视频添加175种语言和地方方言，提供更加沉浸的体验。

使用网址：demo.heygen.com

10、声音克隆

主要推荐：MiniMax Audio。只需要10s，即可克隆任何人的声音，支持30多种语言。该功能，目前仅在海外上线（测评文）。

体验地址（需要魔法）：

https://www.minimax.io/audio

11、AI音乐

主要推荐：Suno 4，可一键写歌，需要科学上网，目前免费。

目前，Suno可生成最长4分钟歌曲，在音频质量、歌词创作和音乐结构等方面有显著提升。

使用网址：suno.com

12、AI写作

主要推荐：

1）Napkin。一款AI写作辅助工具，由前谷歌成员创立。

Napkin能够将文字以若干种结构图可视化，包括但不限于流程图、图表、树状图、棱锥图、矩阵图、结构图和维恩图等。

体验网址：

https://app.napkin.ai/signin

2）AI Scientist

由前谷歌研究员推出的一款新模型AI Scientist，自称全球首个全自动化科学研究AI系统，能实现从构思到撰写论文和同行评审的整个科学过程。

用户只要提供一个想法，就能够生成一篇论文，而论文成本不到15美元。相关研究于8月12日发布在预印平台arXiv上。

开源地址：http://github.com/SakanaAI/AI-Scientist

论文链接：https://arxiv.org/abs/2408.06292

13、AI医药

主要推荐：AlphaFold 3，谷歌DeepMind出品，可准确预测蛋白质、DNA、RNA以及配体等生命分子的结构。

2024年10月，AlphaFold开发者获得诺贝尔化学奖。11月，谷歌将这个模型进行开源，造福人类。

模型网址：

https://golgi.sandbox.google.com/about

14、AI PPT

主要推荐：Gamma，不需科学上网，可用QQ邮箱注册，排版、配图质量较高，AI PPT的天花板。付费，个人版10美刀/月。

网址：https://gamma.app

15、AI编程

主要推荐：Cursor、Trae。基于ChatGPT、Claude等模型，支持Python、Java、C#、Javascript等多语言，提供代码自动生成、编辑、补全、优化、解释等功能。

体验地址：https://www.cursor.com

16、AI游戏

主要推荐：Oasis。由两家初创公司Etched、Decart AI联合开发，推出世界上首个实时生成的AI游戏「Oasis」。

你在其中体验到的每一帧都来自扩散模型的实时预测，游戏画面持续以20帧每秒的速度实时渲染，零延迟。

体验地址：

https://oasis-model.github.io/

往期榜单：

AI产品推荐榜（2025.02）

AI产品推荐榜（2025.01）

AI产品推荐榜（2024.12）

AI产品推荐榜（2024.11）

AI产品推荐榜（2024.10）

AI产品推荐榜（2024.09）

AI产品推荐榜（2024.08）

AI产品推荐榜（2024.07）

AI产品推荐榜（2024.06）

AI产品推荐榜（2024.05）

（文：沃垠AI）

2025 年 12 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

发表评论 取消回复

发表评论取消回复