重磅!亚马逊云科技Nova模型家族横空出世,「选择」才是王道

在2024亚马逊云科技re:Invent全球大会上,亚马逊云科技发布了Nova模型家族,包括Micro、Lite、Pro和Premier四大核心模型。Nova Lite和Pro分别超越了GPT-4o Mini和GPT-4o。Nova Canvas发布支持图像生成,并超越DALL·E 3和Stable Diffusion 3.5 Large。Nova Reel则推出视频生成功能,能够生成工作室级别的视频内容。亚马逊云科技还发布了P6系列实例、Trn2实例及Trainium3芯片,以支持Nova模型家族的强大性能。

智驾公司下场搞AI视频生成,模型上线即开源

国内智能驾驶公司图森未来发布了开源视频生成模型Ruyi,无需输入提示词即可将图片转换为5秒最高分辨率720P的视频。其支持多种风格,并提供了详细的使用说明和代码链接。但模型仍存在一些问题,如手部畸形、面部细节崩坏等。

见证历史!AI想的科研idea,真被人类写成论文发表了

AI提出的想法被人类写成论文。一篇关于神经网络中的最小描述长度与’grokking’现象关系的研究,揭示了训练过程中模型复杂性的动态变化,并提出了基于失真压缩的新方法来衡量神经网络的复杂性。

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

本文介绍了一种基于生成式视觉编码器Florence-2的多模态大语言模型Florence-VL,通过创新的深度广度融合策略结合多层次、多任务视觉特征,实现了在多种多模态基准任务上的卓越性能。