日期: 2025 年 3 月 14 日
arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读
2025年arXiv论文将自动生成博客风格概述。alphaXiv结合Mistral OCR和Claude 3.7生成清晰易懂的文章,大幅提高科研效率。
OpenAI紧急上书,矛头直指DeepSeek!15页提案欲锁死中国AI
OpenAI提交了一份长达15页的政策建议报告,呼吁美国政府立法禁止DeepSeek,并为AI公司提供豁免权以换取模型共享。目的是在中美竞争中确保美国的技术领先地位。
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
清华系科创企业清程极智联合清华大学团队开源大模型推理引擎”赤兔”,支持非H卡设备运行原生FP8模型,相比vLLM方案,使用GPU数量减少50%,输出速度提升3.15倍。
CVPR 2025 VAST和北航开源MIDI,从单张图像端到端生成三维组合场景
本文介绍了一篇关于 MIDI 模型的研究论文,MIDI 能够从单张图像生成高几何质量的组合式 3D 场景。该模型在多个数据集上的表现超越现有方法,并有望应用于建筑设计、虚拟现实等多个领域。
潞晨科技正式推出 Open-Sora 2.0,全新开源的 SOTA 视频生成模型
潞晨科技推出Open-Sora 2.0开源视频生成大模型,性能媲美OpenAI Sora,支持720p高分辨率和流畅24FPS视频生成。
AI浏览器操控革命!MCP-Playwright:AI自动化神器,可执行JS代码进行复杂交互任务!
通过MCP-Playwright协议,大语言模型如Claude能够直接控制浏览器进行网页交互、数据抓取等任务。它支持点击按钮、填写表单、执行JavaScript代码等功能,并提供截屏和分析页面的能力。