国内外AI产品推荐榜(2025.5)


AI产品推荐榜(2025.5)


照例,继续给大家更新本月的AI产品推荐榜。


所谓推荐,即代表可以直接上手使用,而非期货、内测版本。


本期推荐榜,涉及AI Chatbot、DeepResearch、API推荐、世界模型、AI绘图、AI视频、AI搜索、AI音乐、AI社交、电脑AI、AI会议、AI写作、AI编程、Agent编排、通用Agent、数字人、AI 3D、AI Audio、AI办公、AI浏览器、AI翻译、AI导航网站、AIGC检测、AI财经、AI医疗、AI PPT26个场景,国内外共140款AI。


推荐榜,分为国内、国外版。国内版,直接使用,免费为主(部分收费)。国外版,大部分需要魔法,付费为主。


阅读提示:
1)加粗,为重点推荐产品。
2)标红为新产品(含新功能)。

入榜新AI


本月入榜新AI产品(含新功能),以全新模型、全新技术为主。进入新一年,AI技术迎来全新的变化,带来了很多新的惊喜。以下是详细情况。


1、Qwen3


4月29日,阿里发布Qwen3,并开源包括旗舰模型Qwen3-235B-A22B(参数235B,激活参数22B)在内的8款不同尺寸模型,带来了国内首款混合推理模型


我们整理了10+提示词,帮你深度解锁Qwen3。


2、DeepSeek-Prover-V2-671B


4月30日,DeepSeek开源了新模型DeepSeek-Prover-V2-671B,这是一个专门解决数学问题的专家模型。模型性能非常强大,就连7B模型都秒杀了很多模型。


Huggingface开源网址:

https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B


3、豆包“超能创意”


4月26日,豆包灰度内测“豆包CreationAgent v1.0 Beta”(正式上线版改为“超能创意”),可用嘴改图,一次性生成多达20张图片,特别擅长分镜和绘本制作,而且还保持了超强的一致性(见测评文)。


体验地址:https://www.doubao.com


4、Step1X-Edit


4月26日,阶跃星辰发布并开源图像编辑模型Step1X-Edit,性能达到SOTA级。Step1X-Edit不只能“改图”,更能“听得懂、改得准、保得住”。


Github:

https://github.com/stepfun-ai/Step1X-Edit


HuggingFace:

https://huggingface.co/stepfun-ai/Step1X-Edit


体验网址(阶跃新官网):stepfun.com


5、心响APP


4月22日,百度推出通用智能体心响APP,可通过自主规划与多智能体协作,一站式解决用户复杂问题。目前,仅支持安卓版体验。


6、Vidu Q1


4月22日,生数科技发布Vidu Q1模型,在VBench Leaderboard榜单上登顶,超越Runway 、Sora、LumaAI等视频模型,拿下文生视频赛道榜单双第一。


体验地址:Vidu.cn


7、飞猪「AI问一问」


4月21日,飞猪旅行推出“AI问一问”功能。结合飞猪的行业数据和大模型的深度研究能力,大幅降低AI幻觉问题。通过多专家模型协作工作,为用户提供真实、可靠的旅游攻略。


体验方式:飞猪F5及以上会员。


8、扣子空间


4月18日,扣子内测通用智能体「扣子空间」。它是类似Manus、Genspark的通用Agent,只需要大白话命令,即可完成各种复杂任务,与多Agent协作工作,还支持MCP。目前正在内测,免费使用(见测评文)。


体验地址:https://space.coze.cn


9、微信「元宝」


4月16日,微信上线AI助手「元宝」。「元宝」能联网搜索、查天气、总结文章/链接、识别图片、总结文件、总结B站/抖音,并且支持语音对话。


10、Z.ai


4月15日,智谱一口气开源了基座、推理、沉思6款模型(详细介绍)。


同时,启用了全新的全球域名Z.ai,支持3款模型:GLM-4-32B、Z1-32B和Z1-Rumination-32B,基座、推理、沉思,该Z.ai的,都Z.ai。


体验地址:Z.ai


11、可灵2.0


4月15日,快手发布可灵2.0模型,在运镜、动作稳定性、物理交互和语义理解上有大幅提升。不过,价格非常昂贵,新模型也被戏称为“可贵”,一支5s视频成本10元。


体验地址:https://app.klingai.com


12、Seed-Thinking-v1.5


4月14日,字节跳动Seed团队发布最新的思考模型Seed-Thinking-v1.5,在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,模型采用MoE架构,总参数200B。


目前,仅支持火山引擎API接口调用。预计不久,将全量上线豆包。


技术报告链接:https://github.com/ByteDance-Seed/Seed-Thinking-v1.5


13、即梦3.0


4月3日,即梦推出图片3.0模型,在语义理解、小字稳定性、画面构图与排版以及美感方面有大幅提升,能够直出各种海报(见测评文)。


在模型竞技场上,丝毫不逊GPT-4o、Imagen 3、Midjourney v6.1、FLUX 1.1 Pro、Ideogram 3.0等文生图模型。


体验地址:https://jimeng.jianying.com


14、Genspark


4月3日,前百度高管创办的Genspark推出通用智能体Genspark Super Agent,集成AI搜索、浏览器和强大智能代理功能,能自主思考、规划和执行各种任务,如旅行计划、视频内容生成、数据可视化以及打电话等。


体验地址:https://www.genspark.ai


15、小白研报


4月,问小白推出DeepResearch功能「小白研报」。小白研报特别擅长解答复杂问题(见测评文),如财报分析、学术/商业研究以及生活场景里复杂的策略规划等。


思考步骤长达30+轮,可浏览上百个网页,并生成一个专业、结构清晰以及可视化图表的长文报告(平均可达2W字)


体验地址:https://www.wenxiaobai.com


16、AutoGLM沉思


3月31日,智谱发布全球首款集深度研究和操作执行于一体的自主智能体「AutoGLM沉思」。


「AutoGLM沉思」不仅具备DeepResearch的能力,还拥有动手能力。它可以像人一样自主浏览和操作网页,可以一边进行复杂思考,一边执行任务操作(见测评文)。


体验路径:前往智谱清言官网,下载智谱清言PC版,在智能体中心搜【AutoGLM沉思】。


17、MiniMax Audio


3月31日,MiniMax Audio推出Speech-02系列语音模型(见测评文),支持全球30+语种,一次性可输入20万字符,合成语音自然,大幅度解决了此前TTS存在的停顿、语调变化、情感表达等问题,人声相似度达到99%。


比如,这是模仿林志玲的声音,非常相似。


体验地址(需要魔法):

https://www.minimax.io/audio


18、Qwen2.5-Omni


3月27日,阿里开源全模态模型Qwen2.5-Omni-7B(见测评文),在多模态基准上刷新世界纪录,在seed-tts-eval语音生成基准上媲美人类水平。


Hugging Face:

https://huggingface.co/Qwen/Qwen2.5-Omni-7B


19、豆包「深度思考」


3月27日,豆包上线DeeperSearch功能「深度思考」(见测评文)。面对复杂问题,豆包会先推理,再搜索,支持边搜边想。


体验地址:www.doubao.com


20、Mureka O1


3月26日,昆仑万维推出全球首款音乐推理模型Mureka O1和Mureka V6,听感评测超过Suno V4(见测评文)。


我也用Mureka O1写了首歌,欢迎大家来听。


体验地址:www.mureka.ai


21、DeepSeek-V3-0324


3月25日,DeepSeek V3基座模型进行“小版本”更新,参数685B,在代码能力上有显著提升(见测评文),支持MIT许可开源。


新模型上线DeepSeek官网,支持HTML代码预览。


22、混元T1


3月21日,腾讯混元发布T1正式版,更快、更好。更快,首字秒出,吐字速度60-80tokens/s;更好,多项指标处于世界顶级水平(前五)。


T1正式版体验入口:

https://llm.hunyuan.tencent.com/#/chat/hy-t1


23、秒哒


3月24日,百度“秒哒”正式全量上线,带来国内首个“对话式”应用开发平台。平台采用”无代码编程+多智能体协作+多工具调用”技术组合,用户仅需通过自然语言描述需求,可自动生成完整功能代码。


体验链接:

https://cloud.baidu.com/product-s/miaoda_home


24、Hunyuan3D 2.5


3月18日,腾讯混元一口气开源了5款3D生成模型。


新模型带来多视图输入(几张不同视角的照片就能合成3D)、智能减面(自动给模型瘦身)、PBR材质升级(质感更细腻、更逼真)以及多格式兼容四大功能,可帮助大家轻松、专业地玩转3D世界。


4月23日,腾讯混元3D模型升级至2.5版,建模精细度上大幅提升,分辨率提升至1024,参数量也从1B提升至10B。


混元3D体验网址:

https://3d.hunyuan.tencent.com


Huggingface开源社区:

https://huggingface.co/spaces/tencent/Hunyuan3D-2mv 


Github代码库:

https://github.com/Tencent/Hunyuan3D-2


25、文心4.5和X1


3月17日,文心大模型4.5如期上线。同时,百度还意外地带来了自家的推理模型文心X1。新模型全部免费,多模态理解能力优秀,理解、生成、逻辑、记忆能力全面提升(见测评文)。


一个月后的4月25日,百度相继发布了2个模型的Turbo版,速度更快,性能更强,价格更便宜。

体验地址:https://yiyan.baidu.com


26、夸克「AI超级框」


3月13日,阿里推出AI旗舰应用——新夸克。全新夸克基于Qwen领先的推理及多模态大模型,全面升级为无边界的“AI超级框”。


与对话式AI不同,夸克将AI对话、深度思考、深度搜索、深度研究、深度执行整合到一个极简“AI超级框”内,一站式满足用户需求。


4月27日,夸克AI超级框发布全新AI相机,拍照问夸克,啥都能答,啥都会答。


27、Manus


3月6日,蝴蝶效应发布全球首款通用智能体Manus。这是一个划时代的产品,自此以后各种“通用智能体”如雨后春笋般冒了出来。


不同于常规AI工作流,Manus真正实现了从目标设定到成果交付的全链路自主执行,完全媲美人类专家:通过多智能体协同架构,它能自主分解任务、调用工具链,甚至实时修正执行路径。


体验地址:https://manus.im


28、QwQ-32B


3月6日,阿里推出QwQ-32B推理模型,32B的小参数实现了R1 671B的效果。时至今日,QwQ-32B依然能打,常在各大基准扮演对标模型。


体验地址:https://chat.qwen.ai


29、Trae


3月3日,字节发布国内首款AI原生IDE——Trae国内版,集成豆包1.5Pro和满血版DeepSeek R1、V3模型。


4月23日,Trae进行了大更新(见测评文),支持MCP、自定义智能体、自定义AI规则以及上下文能力增强。能力已与Cursor看齐,甚至中文体验更胜一筹。


体验地址:https://sourl.cn/6SQGmz


30、PixVerse V4


2月24日,爱诗科技发布PixVerse V4模型,新增音效、对口型、多种视频风格实时重绘等功能,最关键是生成速度大幅提升,最快5s出片。


体验地址:https://app.pixverse.ai


31、o3、o4mini


4月17日,OAI推出新一代推理模型o3和o4mini。o3模型,首次将图片推理融入CoT思维链中。在多项基准测试中,o3名列前茅,算是目前性能最强的推理模型。

图自赛博禅心


o4mini,可以理解为是OAI性价比最高的推理模型,部分场景超过o3,便宜又快,适合跑量任务。


32、GPT-4.1


4月15日,OAI推出新模型GPT-4.1,在代码、指令遵循和上下文方面有显著提升,支持最高100万token的上下文。同时,把自家的GPT-4.5淘汰了。


OAI表示,4.1系列是API专供,主打性价比。Btw,OAI他们家的命名,是真够乱的。


33、A2A协议


4月10日,谷歌开源发布首个智能体交互协议A2A(Agent to Agent Protocol),可以让不同框架和模型编排的智能体相互协作。


GitHub仓库:

https://github.com/google/A2A


34、Claude也能Research了


4月16日,Anthropic推出两个重磅新功能:Research以及与Google Workspace集成。


Research功能可快速检索网络与内部文件,精准回答复杂问题;Google Workspace集成则让用户能无缝调用Gmail、日历和文档信息,轻松完成任务。


35、Midjourney V7


4月4日,Midjourney正式推出V7模型,在人体、手部和各类物体的细节呈现上更加连贯自然。同时,Midjourney推出了草稿模式,大幅提升速度的同时,降低使用成本。


体验地址:

www.midjourney.com


36、Gen4


4月1日,在举例上代模型接近1年后,Runway最新视频模型Gen4姗姗来迟。Gen4重点提升了一致性、物理遵循和图生视频能力。


体验地址:https://app.runwayml.com


37、ideogram 3.0


3月26日,Ideogram正式推出3.0版本,在画质、光影细节、语义理解、文本生成和风格控制上都有进一步提升。


体验地址:https://about.ideogram.ai/3.0


38、Gemini 2.5 Pro


3月26日,谷歌发布Gemini 2.5 Pro,在多项基准测试中全面超越OpenAI o3-mini,Claude 3.7 Sonnet、Grok-3和DeepSeek-R1。


Gemini 2.5 Pro编程能力优秀,可一句话生成各种高级感满满的可视化图表。


体验链接:

https://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25


39、ChatGPT-4o生图


3月26日,ChatGPT-4o上线本应于1年前上线的生图能力。因采用自回归模型,4o在生图能力上断层级领先,对语义理解高度遵循,其吉卜力风格被全网刷屏(见测评文)。


40、Gemini 2.0 Flash


3月14日,谷歌推出Gemini 2.0 Flash多模态模型,可以用嘴改图,比如换装、换包装、换场景以及生成连续性图片(比如菜谱、绘本、分镜),主体一致性保持较好。


体验地址:

https://developers.googleblog.com/en/experiment-with-gemini-20-flash-native-image-generation/


41、Claude 3.7 Sonnet


2月25日,Anthropic公司发布Claude 3.7 Sonnet模型,这是一款兼具“标准模式”和“推理思考模式”的混合推理模型。模型在数学、物理和编程等任务上表现优秀,特别是代码能力上遥遥领先。


体验链接:Claude.ai


42、Grok3


2月18日,xAI推出新一代AI模型Grok3,被马斯克称为“地球上最聪明的人工智能”。Grok3引入了CoT推理能力,并推出DeepSearch和DeeperSearch深度研究功能,


体验地址:https://x.ai/grok


国内AI推荐

1、AI Chatbot

主要推荐:

1)DeepSeek。基础模型更新至V3-0324后,中文能力、代码能力显著增强,全球第一梯队水平,国内前三。

体验路径:https://chat.deepseek.com

2)豆包。依托字节资源,豆包用户疯狂增长,APP下载量和月活排全国第一。豆包上有很多比较实用的功能,特别适合新手使用。

体验网址:https://www.doubao.com

3)Qwen Chat。新上线千问3模型,带来了国内首款混合推理模型,支持MCP和工具调用,综合性能国内前三,世界前五。

体验地址:https://chat.qwen.ai

2、API部署模型及平台

主要推荐:

1)Qwen。全球开源模型最多的模型厂商,当之无愧源神地位。API价格亲民,在阿里云百炼即可调用。

API调用地址:https://bailian.console.aliyun.com

2)Deepseek。国产之光,性能直追OpenAI。API价格亲民,常被称作AI届拼多多。

API开放平台:https://api-docs.deepseek.com/zh-cn

3)GLM。智谱一直走在开源的路上,先后开源了多个模型。比如其最新的GLM基座、推理和沉思模型,全部开源。

智谱开放平台:https://bigmodel.cn/

3、DeepResearch

主要推荐:

1)ChatGPT的DeepResearch。基座模型来自o3,是目前最强的DRDeepResearch)功能。

体验地址:https://chatgpt.com

2)智谱沉思。分别有网页版沉思和AutoGLM沉思(computer use),底模、沉思、推理模型强大,国内深度研究功能的天花板。

体验地址:https://chatglm.cn/

3)小白研报。可展开数十轮深度搜索,能搜索上百个网页,提供深度研究报告(平均2万字),生成可视化页面。

体验地址:https://www.wenxiaobai.com

4)飞猪「问一问」。这是行业数据与大模型结合最好的产品,大幅解决幻觉问题。所有做垂类产品的小伙伴,都建议来体验下飞猪「问一问」。

4、AI绘图


主要推荐:


1)Whee。Whee是美图推出的AI素材生成器,支持文生图和图生图。提供AI改图、风格模型训练、AI修复、AI扩图、AI消除、AI模特图以及提示词库训练等丰富功能。


体验地址:www.whee.com

2)即梦/豆包。字节出品,提供多个生图模型供用户选择。新上线的图片3.0模型,文字能力进一步升级(测评文)。

体验网址:dreamina.jianying.com

3)LiblibAI。哩布哩布是奇点星宇推出的AI绘图创作平台,支持SD图片生成、模型上传与分享、ComfyUI工作流以及LoRA训练等功能。

体验网址:www.liblib.art/


5、AI视频

主要推荐:

1)可灵2.0。4月,可灵升级至2.0版,能力依然全球T0级,就是有点贵。支持文生、图生(首尾帧)、对口型、运动笔刷、人脸模型训练、API调用等功能。


使用网址:klingai.kuaishou.com

2)海螺AI。支持文生、图生,新增参考生视频、运镜模式等功能,泛化能力强,想象力丰富(见测评文),在海外很火。

体验链接:hailuoai.com

3)万相2.1。基础模型(文生&图生)大幅升级,在语义理解、运动稳定性和细节表现方面大幅优化,支持中文字特效生成(详见测评文),全部免费且开源。


体验地址:https://tongyi.aliyun.com/wanxiang


4)即梦视频3.0。5月初,即梦视频模型升级至3.0,与图片3.0模型配合,非常便利内容创作。


体验地址:https://jimeng.jianying.com


6、AI搜索

主要推荐:

1)纳米。功能丰富,模型众多,新增知识库、本地模型部署、MCP广场、深度研究智能体等功能,都很实用。

体验地址:https://www.n.cn

2)夸克。上线超级AI框、AI相机,可解万千问题。最近,还上线了DeepSearch功能。


下载地址:www.quark.cn

3)百度“AI搜”。百度专为AI搜索打造,无广清爽界面,接入了最新的文心和DeepSeek模型,双模驱动。

体验网址https://chat.baidu.com

4)秘塔AI搜索。接入DeepSeek模型,新增知识库、研究模式和学习平台。


体验链接:https://metaso.cn


7、AI会议

主要推荐:

1)百度网盘。听记功能,可一键整理各类音频,提供多种会议模板供用户选择。

体验地址:

https://pan.baidu.com/embed/listennote


2)通义“效率”工具。可帮助大家进行会议记录,会议音频整理,学习视频整理。

体验网址:

https://tongyi.aliyun.com/efficiency


8、AI音乐

主要推荐:Mureka。国内首款音乐推理模型,性能完全不输Suno V4,可一键生成一首歌曲和BGM(见测评文)。

体验地址:www.mureka.ai

9、AI Audio

主要推荐:MiniMax Audio。目前最强的TTS工具(见测评文),内置了300多种音色库,还可以进行声音克隆。

体验地址(需要魔法):

https://www.minimax.io/audio


10、Agent编排工具

主要推荐:扣子。简单易用、好上手,支持豆包、Moonshot、Qwen、MiniMax、DeepSeek等模型,可发布到豆包、飞书、企微、公众号、掘金社区等平台。


使用网址:www.coze.cn


11、通用智能体

主要推荐:

1)Manus。全球首款通用智能体,底模Claude 3.7,具备强大的工具调用能力和深度搜索、深度研究能力。

体验路径(需要魔法):manus.im

2)扣子空间。国内快速复刻Manus的通用智能体,支持MCP,擅长深度搜索和深度研究能力。

体验路径:https://space.coze.cn/

3)AutoGLM沉思。擅长深度搜索和写作,具备computer use能力。

体验路径:前往智谱清言官网,下载智谱清言PC版,在智能体中心搜【AutoGLM沉思】。

12、AI写作


主要推荐:


1)ima copilot。由腾讯推出的AI智能工作台,可搜微信公众号、B站和知识库广场,支持即时编辑、扩写、润色。

下载网址:https://ima.qq.com

2)自由画布。由百度文库&百度网盘联手打造,供用户自由创作。

支持全模态内容,无论是文档、PPT、PDF、图片、音频、视频、URL链接还是本地、云盘、公域,都可以直接拖进“自由画布”,一拖一化,进行内容创作。

体验链接:https://wenku.baidu.com/board


13、AI编程

主要推荐:Trae。由字节推出的AI IDE产品,海外版集成GPT-4.1、Claude-3.7等顶尖模型,国内版集成DeepSeek-V3-0324、豆包1.5pro等优秀模型,支持MCP。


体验链接:https://www.trae.ai


14、3D模型

主要推荐:混元3D。支持图生和文生3D,可生成各种3D模型。


体验链接:

https://3d.hunyuan.tencent.com/

15、AI浏览器


主要推荐:夸克。不仅是浏览器,还是超级AI框(APP端),新上线DeepSearch深度搜索功能。

支持一键AI搜索、写作、PPT生成、视频总结、文件总结、截屏搜、划词搜等功能。


下载链接:quark.cn

16、AI PPT

主要推荐:通义PPT、Kimi PPT助手、AiPPT、百度文库、讯飞智文

关于AI PPT的使用攻略:一次性给大家讲透了,特别适合小白


17、AI财经

主要推荐:Reportify。查研报、读财报、解析财报非常方便,适合投资人士使用。
体验链接:https://reportify.cc


18、AI翻译


主要推荐:沉浸式翻译浏览器插件方式使用,支持双语显示,降低原网页“侵入性”,支持API接入各个大模型。


体验地址:https://immersivetranslate.cn/


19、AI医疗


主要推荐:紫荆AI医生,由清华团队研发,12月刚上线42位AI医生,目前处于内测期。


体验链接:
https://www.tairex.cn/agent-hospital

论文链接:

https://arxiv.org/pdf/2405.02957v1


20、AI导航网站


主要推荐:AI工具集。汇集了市面上几乎所有的AI产品,分类清晰、产品丰富,可随时查找需要的AI。

体验网址:ai-bot.cn


21、数字人


主要推荐:剪映。剪映数字人支持对口型,可自由调节数字人的形象、音色、景别以及背景,付费。


目前,国内数字人技术整体都还不太成熟,而且很贵。

22、AIGC检测


主要推荐:朱雀大模型。支持图片和文字检测,AI检出率达到95%(详见测评文)。

体验网址:https://matrix.tencent.com/ai-detect


国外AI推荐


1、AI Chatbot

主要推荐:

1)GPT-4o、o3

2024年9月13日,OpenAI发布推理模型o1(mini、preview);12月5日,o1满血版上线;12月21日,OpenAI发布下一代模型o3;2025年2月1日,o3-mini正式上线;4月17日,o3正式版上线,同时推出o4-mini,首次将图片推理融入CoT思维链中。

o系列模型在推理能力上显著提升,进入博士级水平,我们离AGI越来越近。

使用网址:www.chatgpt.com

2)Claude 3.7 Sonnet

作为OpenAI最强竞争对手Anthropic,2月推出Claude 3.7 Sonnet,带来了全球首款混合推理模型,综合性能非常强大。
使用路径:Claude.ai


3)Gemini 2.5 Pro


进入2025年,谷歌非常争气,接连推出Gemini家族模型,与ChatGPT、Claude一起奠定了“御三家”(公认最强的三家模型)的排面。


体验链接:https://aistudio.google.com

2、API部署推荐

主要推荐:GPT4.1/o4-mini,性能强劲,价格亲民。新一代Llama4有点拉跨,所以不做推荐。


3、世界模型

主要推荐:李飞飞团队打造的“空间智能”模型,只需要一张图,就可以生成一个逼真的3D世界。
产品详情:

https://www.worldlabs.ai/blog


4、电脑AI

主要推荐:Copilot

2024年9月,Copilot更新,开启Web+Work+Pages的工作流。推出Copilot Pages、办公全家桶以及Copilot智能体等产品。

5、AI绘图

主要推荐:

1)Midjourney。2025年4日,在4o影响下,Midjourney被迫升级至V7版,出图质量进一步提升。

使用网址:www.midjourney.com

2)GPT-4o。由于4o采用了自回归技术路线,生图能力和使用场景比其他模型大幅领先。

比如,可以直接做这样一张json卡片(见攻略文),其他生图模型基本都不能。

6、AI视频

主要推荐:

1)Veo 2。谷歌出品,支持文生、图生,最高4k分辨率、8s视频,在光影、镜头、运动、质感、语义遵循等方面表现优秀,超过Sora、Gen3以及luma等知名模型。


体验网址:

https://deepmind.google/technologies/veo/veo-2


2)Gen 4,2025年4月,Runway推出新模型Gen4,重点提升了一致性、物理遵循和图生视频能力。


体验网址:

https://app.runwayml.com


3)Sora。2024年12月10日,Sora正式上线。支持文生、图生以及V2V(视频生视频),最长时长20s,最高画质1080P。

体验地址:www.sora.com

4)RAY2。训练量是前身1.6模型的10倍,在语义理解、物理动作、运镜、光影、物理模拟、色彩等方面有大幅升级。

体验链接:https://lumalabs.ai/ray

7、Agent编排工具

主要推荐:

1)Coze,字节出品,依托ChatGPT,可轻松创建AI智能体。

使用网址:www.coze.com

2)GPTs,ChatGPT官方智能体创建器,可根据GPT4o/4.1/o3创建个人智能体。


8、AI搜索

主要推荐:Perplexity,新型对话式AI搜索的鼻祖,需科学上网。2月,Perplexity接入了DeepSeek R1模型。
使用网址:www.perplexity.ai

此外,Felo、New Bing、SearchGPT等产品也值得一试。比如felo,可搜小红书、Reddit等封闭平台,还支持多模型调用。

9、数字人

主要推荐:HeyGen,收费,49~150美刀/月。用户只需输入脚本,即可在几分钟内生成用于营销、沟通、销售、学习等的视频。

HeyGen支持使用AI语音和口型同步为视频添加175种语言和地方方言,提供更加沉浸的体验。


使用网址:demo.heygen.com


10、声音克隆

主要推荐:MiniMax Audio。只需要10s,即可克隆任何人的声音,支持30多种语言。该功能,目前仅在海外上线测评文
体验地址(需要魔法):

https://www.minimax.io/audio


11、AI音乐

主要推荐:Suno 4,可一键写歌,需要科学上网,目前免费。

目前,Suno可生成最长4分钟歌曲,在音频质量、歌词创作和音乐结构等方面有显著提升。

使用网址:suno.com


12、AI写作

主要推荐:

1)Napkin。一款AI写作辅助工具,由前谷歌成员创立。


Napkin能够将文字以若干种结构图可视化,包括但不限于流程图、图表、树状图、棱锥图、矩阵图、结构图和维恩图

体验网址:
https://app.napkin.ai/signin

2)AI Scientist


由前谷歌研究员推出的一款新模型AI Scientist,自称全球首个全自动化科学研究AI系统,能实现从构思到撰写论文和同行评审的整个科学过程。

用户只要提供一个想法,就能够生成一篇论文,而论文成本不到15美元。相关研究于8月12日发布在预印平台arXiv上。


开源地址:http://github.com/SakanaAI/AI-Scientist

论文链接:https://arxiv.org/abs/2408.06292


13、AI医药

主要推荐:AlphaFold 3,谷歌DeepMind出品,可准确预测蛋白质、DNA、RNA以及配体等生命分子的结构。

2024年10月,AlphaFold开发者获得诺贝尔化学奖。11月,谷歌将这个模型进行开源,造福人类。
模型网址:

https://golgi.sandbox.google.com/about


14、AI PPT

主要推荐:Gamma,不需科学上网,可用QQ邮箱注册,排版、配图质量较高,AI PPT的天花板。付费,个人版10美刀/月。

网址:https://gamma.app


15、AI编程

主要推荐:Cursor、Trae。基于ChatGPT、Claude等模型,支持Python、Java、C#、Javascript等多语言,提供代码自动生成、编辑、补全、优化、解释等功能。


体验地址:https://www.cursor.com


16、AI游戏

主要推荐:Oasis。由两家初创公司Etched、Decart AI联合开发,推出世界上首个实时生成的AI游戏「Oasis」。

你在其中体验到的每一帧都来自扩散模型的实时预测,游戏画面持续以20帧每秒的速度实时渲染,零延迟。

体验地址:

https://oasis-model.github.io/



往期榜单:

AI产品推荐榜(2025.02)

AI产品推荐榜(2025.01)

AI产品推荐榜(2024.12)

AI产品推荐榜(2024.11)

AI产品推荐榜(2024.10)

AI产品推荐榜(2024.09)

AI产品推荐榜(2024.08)

AI产品推荐榜(2024.07)

AI产品推荐榜(2024.06)

AI产品推荐榜(2024.05)

(文:沃垠AI)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往