多模态输入归档

Lovart正式发布推出ChatCanvas，想挑战Figma和Canva？

2025年7月25日12时作者硅星人Pro

Figma与Canva是两座绕不开的大山。前者凭借专业性在上市前夕估值冲向百亿美金大关，后者则以易用

2025年7月24日16时作者机器之心

约
80%
为遗传性疾病。但大多数患者在确诊前需经历
5
年以上的延迟、
7
次以上就诊、
3
次以

2025年7月12日8时作者 NLP工程化

Long-RL提供了一种新的框架来应对超长序列任务的强化学习训练，支持小时级长视频、多模态输入和图像/视频生成模型的强化学习。

2025年6月21日14时作者 AI技术研习社

2025年AI Agent元年来临，大模型进化成能‘干活’的智能体。Agent具备感知环境、理解目标、拆解任务、调用工具等能力，从被动等待指令到主动规划执行并学习反馈。

2025年4月1日14时作者 AI先锋官

上发表演讲，他提到：
“仅靠文本训练，我们无法实现达到人类水平的AI。”
他表示，且不说达到人类的水

2025年3月14日16时作者量子位

谷歌推出Gemini原生图像生成测试版，支持图文混排输出、多轮编辑及基于世界知识的生成等新功能。

2025年3月14日12时作者每日AI新工具

Google AI Studio中的Gemini 2.0 Flash实验性功能支持原生图像生成和多模态对话式编辑。它能根据用户故事描述生成插图，并且允许通过多轮对话来修改图像细节，同时还提供个性化的AI研究助手Deep Research。