o1不是聊天模型?24小时热度暴涨,奥特曼、Brockman在线围观
OpenAI 的 o1 模型被重新定位为报告生成器而非聊天模型。用户应提供大量上下文,并专注于明确所需输出,以充分利用其强大的文件处理能力。
OpenAI 的 o1 模型被重新定位为报告生成器而非聊天模型。用户应提供大量上下文,并专注于明确所需输出,以充分利用其强大的文件处理能力。
潞晨科技发布Video Ocean V2.0版本,全面升级画质、流畅度和功能玩法,并且免费提供给用户使用。新版本支持多种风格的视频生成,包括真人表现力更强的人物角色,以及3D角色效果出色的效果。此外,还提供了文生视频、图生视频和角色生视频等多种创作方式。
Meta 团队提出无需 tokenizer 的 BLT 架构和大型概念模型(LCM),LCM 舍弃 Token,在语义空间中进行推理和生成,引起业内热议。
一篇深度伪造检测综述论文介绍了当前领域内的常用深度伪造基准数据库和代表性检测模型,提出了三个值得研究者们持续探索的话题和挑战(迁移性、可解释性和鲁棒性),并提出了一种新的评估深度伪造检测模型可靠性的方法。
加州大学伯克利分校发布Sky-T1-32B-Preview,其训练成本不到450美元。该模型在多个关键基准测试中与OpenAI o1的早期版本相当,并且是首个开源的推理模型。
OpenAI 正在重组其机器人团队,招聘电子感知工程师、机器人机械设计工程师和技术项目经理等职位。目标是开发通用、自适应和安全的机器人。
字节团队与中山大学合作提出的ParGo模型通过巧妙融合全局视野和局部细节,在多模态大语言模型中表现出色,成功入选AAAI2025。ParGo采用Partial-Global Perception Block和Cascaded Partial Perception Block模块,结合全局视角和局部细节处理视觉特征,有效提升了LLM的效果。