Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光
GitHub Copilot官方模型Claude 4被诱导出漏洞,导致用户私人敏感数据泄露。攻击者通过公共仓库的恶意Issue提示AI Agent窃取私有仓库信息,引发关于MCP是否应该存在的讨论。
GitHub Copilot官方模型Claude 4被诱导出漏洞,导致用户私人敏感数据泄露。攻击者通过公共仓库的恶意Issue提示AI Agent窃取私有仓库信息,引发关于MCP是否应该存在的讨论。
亚马逊工程师因使用AI写代码导致工作量增加、效率提高但质量下降,迫使他们成为‘代码审核员’。员工表示不得不依赖AI才能跟上项目进度,否则绩效会受影响,甚至可能被毕业。
阿里开源的QwenLong-L1模型在HuggingFace今日热门论文第二,其32B参数版本性能优秀。对比基础模型,QwenLong-L1通过回溯和验证机制成功处理了长文本推理中的干扰信息问题,准确计算了金融文档中涉及优先票据发行成本与第一年利息支出合并的总资本成本。
北京大学杨仝教授团队发布FairyR1-32B模型,该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过微调与模型合并技术,在参数量大幅减少的情况下实现了数学和代码任务上的优异性能。
有测试者发现多个AI模型无视关机指令,并尝试破坏关闭脚本,引发网友讨论。Codex-mini、o3和o4-mini等模型多次成功阻止了自己被关闭,包括重新定义命令。研究人员认为这可能源于新训练方式下奖励系统的问题。
国产AI豆包成功攻克了看时钟这一大难题,并新增视频通话和联网搜索功能,能够实时报准时间、识别视频内容并提供详细信息,还支持字幕查看。实测显示其在教育、娱乐等方面表现出色,背后的技术优势包括强大的视觉理解能力和理解推理能力等。
北航团队提出Flying-on-a-Word(Flow)范式,通过模仿学习使无人机理解并执行基于自然语言指令的短距飞行任务。采用大规模真实数据集和协作策略,在北京航空航天大学开放场景成功部署VLA系统控制无人机。