多模态生成
Meta新AI团队成员曝光:8人来自Open AI,清北、浙大校友占半壁江山
Meta 挖角 AI 研究员,包括华人学者如汪滔、毕树超等加入 Meta。这些新成员在各自领域具有影响力。Meta 已招揽 11 名顶级研究员,涵盖超级智能实验室和多模态研究等多个方向。
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
谷歌发布Gemini CLI开源工具,提供免费的AI编程辅助功能。支持100万上下文窗口和60次/分钟请求限额,允许用户通过命令行自然语言控制Gemini模型写代码、调试等。
天工超级智能体:用 Office Agent 重新定义 AI 生产力
昆仑万维发布天工超级智能体(Skywork)在GAIA Benchmark上力压群雄。Skywork定位为AI版的Office,涵盖文档、PPT和表格三个场景,支持多场景写作、精美可编辑幻灯片生成及数据分析与可视化等功能。
全球智能体榜单新SOTA!中国公司登顶,Office三件套一键生成,全程可控可溯源,打工人直接拿来用
榜单上又一家中国公司登顶!
天工超级智能体(Skywork Super Agents)
,出自昆仑万
生图别只盯着 GPT-4o,这个国产 AI 一次给你 20 张,除了量大管饱还有惊喜|附指南
通过深度学习模型和多模态生成技术,豆包 AI 可以理解和实现模糊的指令需求,实现大量并行生成高质量图片。该服务已应用于创意设计、故事生成等多个领域。
33,000美元奖金池!Meta CRAG-MM挑战赛开启,多模态RAG巅峰对决
Meta CRAG-MM Challenge 2025面向可穿戴设备场景设计,旨在提升视觉问答基准数据集的准确性、上下文理解和实时信息处理能力。通过三个逐层递进的任务全面考察多模态检索增强生成(MM-RAG)系统在现实中的应用。
字节跳动 Top Seed 大模型顶尖人才计划启动了
字节跳动启动2026届Top Seed校招计划,目标招募约30名顶尖博士,涵盖大语言模型、多模态生成等关键领域。此举揭示了对大模型时代底层基础设施的争夺战。
生数科技副总裁:多模态技术定将催生全新内容平台,实现完全个性化、实时可控、可交互|中国AIGC产业峰会
多模态生成技术推动AI视频创作新阶段,生数科技产品副总裁廖谦分享了其对于多模态大模型终局的看法及应用场景。视频生成领域迎来黄金发展期,预计2024年将出现重大突破。