日期: 2025 年 4 月 16 日
多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine框架,能够处理多种条件组合的多条件可控生成任务,并在多个实验中达到SOTA。
速递|8秒视频只是起点,谷歌Veo 2携8秒720P视频登陆Gemini,硬刚OpenAI Sora
谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按钮上传至TikTok、YouTube等平台。
视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1
港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,并且全部代码和数据集均已开源。
喝点VC|a16z对话明星邮件服务公司CEO:Agent将成为主要执行者,产品设计将从“用户体验”走向“Agent体验”
设计需要从以人为本的
UX
(用户体验)转向面向
Agent
的
GX
(
Agent Experi
装满智能体AI的手机,正在呼唤一个“Type-C时刻”
联发科在天玑9400+中引入多项新技术,提升了AI能力,并发布AI开发套件2.0和Neuron Studio工具集,推动智能体AI在手机上的应用。
Claude更新:高级Research功能、深度集成Google Workspace、语音模式即将上线
Anthropic公司升级其AI助手Claude功能,引入Research和Google Workspace深度集成,使其在信息处理能力和工作流程支持方面更强大。
Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升
Anthropic推出Claude两项新功能:Research可快速检索网络和内部文件,与Google Workspace集成让用户无缝调用Gmail、日历和文档信息。