学术
SIGGRAPH 2025 即插即用!港中文、腾讯等提出首个双分支视频修复框架VideoPainter
和编辑能力。
通过构建大规模(390K 视频片段)视频修复数据集,结合轻量级上下文编码器(仅占骨干网
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
OpenAI 推出新功能,ChatGPT 可以参考用户的所有聊天记录提供个性化的回复,并且更智能、个性化。新的记忆功能首批向部分用户推出,但需要在未来几周内逐渐部署。
在线教程丨字节开源 InfiniteYou 图像生成框架,实现高保真面部特征迁移
InfiniteYou 是字节跳动团队推出的身份保持图像生成框架,通过扩散变压器技术确保面部特征在不同场景中的保留。其核心创新InfuseNet提升了身份保真度,并解决了图文对齐偏差和生成质量不佳的问题。HyperAI超神经提供教程及Demo演示。
MLNLP学术Talk第三十期 鲍光胜@西湖大学:AI和人类的差异 – 从推理的因果性和生成文本的可检测性看AI和人类的异同
MLNLP学术Talk邀请西湖大学鲍光胜博士分享AI与人类的差异,包括AI推理过程的表面模仿和生成文本的分布差异。报告聚焦大语言模型内在因果图结构、白盒方法检测LLM生成文本等方面。
如今的Reasoning模型都不具备批判性思维!简单问题, Overthinking!离谱
MLNLP社区是一个国际化的机器学习与自然语言处理社区,致力于促进学术界、产业界及爱好者间的交流合作。最新研究表明,大型语言模型在遇到缺乏关键信息的问题时容易陷入无效思考。
闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源
本文提出了一种新的端到端自动驾驶框架ORION,通过引入QT-Former聚合历史场景信息、VLM进行场景理解与指令生成以及生成模型对齐推理空间和动作空间,实现在闭环评测数据集Bench2Drive上的优异性能。