MiniMax 的新货,是迄今唯一让我充值的 Agent

 

MiniMax 刚上线了一款 Agent,简单用了用,我就充了最高的会员

(先找 MiniMax 的朋友要了 3 次积分,都用完了,实在不好意思再要了)

https://agent.minimax.io/

这东西,应是当下完成度最高的 Agent,必火、必排队

用上瘾了,直接充了最高的会员



先看效果

prompt
搜集特朗普新出的手机的信息,并给他做一个展示介绍页,要像苹果网站那样高端大气,并充斥着特朗普的风格

(可上下滑动,点击看大图)

请访问:https://r01udyvbjw.space.minimax.io/

一定点开
https://r01udyvbjw.space.minimax.io/


全有:图、文、动画、音乐
它甚至自己下载了《Y.M.C.A》

效果令人震惊

我再多放几个例子,每个都做到了产品级交付,太令人震惊了

Gemini 发布报告

“整理 Gemini 2.5 的发布信息,梳理 Gemini 系列历史,做成一个深色主题的网页。”

https://k2wo1qd5yq.space.minimax.io/

这个任务的难点在于:Gemini 的发布极其凌乱,信息分散在 PDF、博客、新闻稿之间,时间线复杂,主题风格抽象、不成体系

但结果呢?它做出来的是完整结构化页面,深灰紫底色,自带模型版本年表、核心参数、发展路线图。整体风格贴合 Gemini 的审美设定,几乎可以直接挂官网

Markdown to Mail 编辑器

“做一个双栏编辑器,左边写 Markdown,右边实时渲染成漂亮邮件样式,支持复制到 Gmail”

https://gi2s2kxl08.space.minimax.io/

讲道理:Gmail 默认的样式有点难看。所以,我总想着哪天能做个邮件排版器,就有了这个

难点在于,Markdown 到邮件 HTML 并不是一一对应,Gmail 对样式支持有限,还要考虑保留格式时的跨平台兼容。

它返回的是一个高保真编辑器,右栏渲染精致,有内置样式系统,还有一键复制按钮,粘进 Gmail 时格式无损、完全可用。

《长安的荔枝》爱好者网站

“根据马伯庸小说《长安的荔枝》,做一个剧情介绍网站,风格设计自己定”

https://daeybocs6y.space.minimax.io/

难点在于,任务没有给任何结构化数据,也没有配色或设计提示,要靠它自己理解小说气质与视觉风格。

结果是一个仿唐风网页:墨绿与朱红主调,宋体正文,卡片式章节导览,像是文化机构做的宣传站点,内容和风格全都对。

冲量动量教学幻灯片

“做一套中学物理课件,讲冲量和动量,要带动画演示”

https://bgzw1kd6pf.space.minimax.io/

这类任务难在对知识本身的理解——动量、冲量涉及物理建模、变量演变,不能只靠图,需要时间轴、变量同步变化

结果是一份完整的动态课件,支持切换板块、实时动画演示,还自动安排了讲解节奏

四冲程发动机交互演示

“做一个 3D 动态演示,讲解发动机的四个冲程”

https://czt5t0nj3m.space.minimax.io/

这是高难度任务,要理解机械结构、运动顺序,还要能用动画表达气体流动状态和变化过程。

其它模型几乎全挂,只有 MiniMax 成功 one-shot 实现:气缸、活塞、进气、压缩、点火、排气,所有过程都有粒子流动、箭头指示、配色表达,带交互、可控节奏、技术注释,能直接用于教学

最离谱的是,MiniMax 的 Agent,为了更好的完成这一任务,竟然生成了很多中间数据

生成了很多文件
数据 belike

宝可梦互动图鉴网页

“搭建一个网站,对前 50 位宝可梦进行交互演示,要用动画,也要进行分类”

数据 belike

这是官方示例:老实说,这种任务我压根没指望它能做成,动画、数据、交互都在同一个 prompt 里,太容易跑偏

结果它一步没乱:自己去查 PokéAPI,识别出图像不够,再去 GitHub 找到 Showdown 的动图图源;分类信息自己拼,图鉴结构、动画样式、交互逻辑也都搭起来了。

第一次运行就成功,动画图准确,分类功能完整,页面能直接上线

… 太尼玛强了

规划令人震惊

比起交付成果,MiniMax 的规划能力,更令人感到不可思议

决策能力,堪比资深开发者

素材处理:不自己造轮子

在宝可梦这个官方示例中,Prompt 是:

“Build an interactive Pokédex webpage featuring the first 50 Pokémon, including their animations and types.”

当我看到这些动图的时候,非常惊讶:“这些素材哪来的?”

这些宝可梦,是会动的:https://rptf11usfn.space.minimax.io/

然后我 F12 仔细看了下,又看了些 log,发现这并不是生成的,而是调用来的:

  • • 查阅 PokéAPI 文档
  • • 发现官方仅提供静态 PNG
  • • 随即去 GitHub 搜索,定位到了 PokeAPI/sprites 仓库
  • • 找到 showdown 动图源,并推断出文件 URL 模板 https://raw.githubusercontent.com/.../[id].gif
  • • 写脚本批量拉取前 50 个宝可梦的动图

这一系列操作,没有人提醒它去做,完全由它自主调度完成。

它竟然…去找了 API

说实话,作为程序员的我,如果是临时做个演示站点,我未必会想到找这种图源,更别说推 URL 模板和合法性检查。

感觉很明确
它比我聪明,比我更会解决问题

数据策略:自己寻找数据

比如我在做「星空记单词 App」这个任务时,给了一个设想:

“设计一个特殊的记单词app,每个单词是星空中的一个星星,星星的亮度是根据记忆保留率算的,可以用SM2算法,当一个单词星星算保留率越来越低快要被遗忘的时候,它就会放大,方便用户去点击,注意不要和其它星星产生遮挡,点击之后相当于进行了一次复习,你要确保你的词库是真实可用的,而不是一个模拟的,这个词库里还会有词组,比如my pleasure,当用户复习了这个词的时候,它其实也连带的复习到了my和pleasure,相应的星星也会被影响,这种连带影响也是要被支持的,另外还支持一下用户选单词难度,比如托福词汇,可以筛选出来一波。请实现这个很有视觉效果的可视化单词记忆app

这个 Prompt 在设计上其实非常复杂,它至少涉及:

  • • 词库真实性
  • • 词组间语义联动
  • • 难度分层
  • • 记忆曲线策略
  • • 可视化排布避障算法

然后它真的完成了

https://38oqzwzo1n.space.minimax.io/

细细的看了流程:

  • • 自己从 GitHub 上找到了多个真实词库(如 KyleBing/english-vocabulary)
  • • 下载数据,分析结构,筛选托福数据
  • • 对每个词构建 SM2 所需的初始字段
  • • 构造「词组联动」的传播机制(复习 my pleasure 会同步影响 my 和 pleasure)
  • • 最终落地成一套交互式 3D 星图(用 React Three Fiber 渲染)

而且还自动构造了简化版本的 JSON 数据,用于前端加载优化。

通过词表,二次构建

这一套链路下来,它从未询问我词库要不要我提供,也从不向我推锅。换句话说,它是「先自己查、自己试、自己解决」。

工程执行:测试流程完成

这个 Agent,在各种项目开发中,都严格遵循测试流程:

  • • 本地开发环境构建
  • • 自动将数据文件拷贝到 public 文件夹
  • • 本地测试通过后构建生产版本
  • • 执行 pnpm build 构建,自动上传至 CDN
  • • 只有测试通过,才对外发布部署链接

而它测试时用的是:模拟用户点击 + 多模态屏幕反馈分析 + 状态标记系统

它会模拟点击、进行各种交互

他真的太懂开发了

它是真懂:太知道怎么干活了

这个事儿…震惊了我一下午

比如在特朗普手机的展示页中,我提出“自动播放 Y.M.C.A 音乐”,它没有直接失败,而是迂回:

  • • 先静音播放,规避自动播放限制
  • • 在用户首次交互后,解除静音并开始播放
  • • 若无交互,使用多重触发(页面可见性变化、滚动、点击、键盘)
  • • 并提示用户「点击以启用声音」,提升感知
这尼玛…绝了

而且,它甚至会修改 audio 元素 DOM 属性,如:

<audio autoplay muted playsinline />

然后在 JavaScript 中主动解开 muted = false

这些策略,是前端工程师在实战中才会知道的那种“技巧”,却被 Agent 自己推理出来并实现。

md….我不敢想了

离谱…离大谱

五、关于“极强的场景感知力”

在特朗普展示页项目中,我只是说了,希望:
要像苹果网站那样高端大气,并充斥着特朗普的风格

它最终给我的:

  • • 页面整体采用红金配色,带有爱国图标(老鹰、星条旗)
  • • Hero 区是特朗普“中弹后举拳”名场面,配合光晕效果和金字标语
  • • 自动嵌入真实的 Trump T1 手机图
  • • 使用精确布局压缩在首屏内完成展示,同时自动播放 Y.M.C.A(带静音解除策略)

这不是简单的风格模仿,而是:
苹果设计语言 + 建国的又红又专

这味道太冲了…
太冲了…
真的太冲了..

牛逼…真的牛逼

总之令人震惊

长话短说
太尼玛牛逼了

在这些案例中,最令我反复震撼的不是“它能生成网页”、“能抓词库”、“能做动画”,而是:

  • • 它会主动查文档
  • • 它会规避使用限制
  • • 它知道图源用 GitHub 的 raw link 更稳
  • • 它在部署前先跑一遍自动化测试
  • • 它知道用户点击是绕过自动播放的关键
  • • 它能用 SM2 建模记忆,也能将视觉与认知合成展示

他真的,比我更聪明…得多…
用生成式思维,来解决工程问题,并且非常高明

One… More More Things

这里,我再放一些官方的例子,款款令人震惊

COLDPLAY粉丝网站

https://c0b09619.space.minimax.io/

太阳、地球、月亮运动关系展示

https://agent.minimax.io/share/270766342852704

团队聚餐餐厅推荐

https://agent.minimax.io/share?share_chat_id=267485559795780

新世纪福音战士介绍PPT

https://agent.minimax.io/share/270774042046594

未曾掉队的 MiniMax

咋说呢……MiniMax 前段时间挺安静的,本以为就这样了

但看到这个 Agent,我觉得——MiniMax 要翻身了

不仅这个,它最近每条线都在往前推:音频模SOTA、M1开源、Hailuo 02发布,全面开花。

老实讲,MiniMax 的这轮发布,有点出乎我的意料,或者说【非常意外】

这家公司,可能真要回来了

或者说,它就没从 T1 掉队过

 


(文:赛博禅心)

《MiniMax 的新货,是迄今唯一让我充值的 Agent》有1条评论

发表评论