阿里巴巴达摩院归档

阿里刚刚开源Qwen-Image，免费版GPT-4o吉卜力，中文最好模型

2025年8月5日8时作者 AIGC开放社区

阿里巴巴达摩院开源文生图模型Qwen-Image，参数200亿，支持多种风格生成、编辑和转换。性能超越FLUX.1，在GenEval等测试中表现优异。

2025年7月12日8时作者 AIGC开放社区

专注AIGC领域的专业社区，聚焦大语言模型在医疗领域的应用研究。目前大模型面临三大难题：医疗知识覆盖不足、幻觉风险高及推理能力欠缺。阿里达摩院开源统一多模态医学大模型灵枢，并详细介绍数据构建与训练方法。

2025年7月10日16时作者 AI前线

sor 搭配 MCP，有可能在毫不知情的情况下，把你的整个 SQL 数据库泄露出去——而攻击者仅靠一

2025年7月9日14时作者小兵的AI视界

光、
CT
、
MRI
、超声、病理等
，并在医疗多模态
/
文本问答和报告生成任务上达到
SOT

2025年6月23日16时作者机器之心

斯坦福大学 CS336 课程发布，引领学生从零开始开发自己的语言模型，涵盖基础、系统等多个单元。

2025年6月18日11时作者量子位

MiniMax发布海螺2.0版本，支持1080P视频生成。新模型提升指令遵循、生成质量，并在光影处理和细节描绘上表现优异。

2025年5月14日23时作者量子位

OmniAudio团队发布了一项研究，能够直接从360°视频生成空间音频。该技术解决了现有视频到音频转换中的方向信息缺失问题，为虚拟现实和沉浸式娱乐提供了新的可能性。

2025年4月28日23时作者极市干货

关注极市平台公众号，获取多模态大模型解读专栏、Transformer系列等技术综述文章。