月度归档: 2025 年 7 月
数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免
大模型被攻击后数学能力骤降,猫猫成了‘罪魁祸首’。研究发现,通过在问题中加入有关猫的事实或对话术改变问题语义,推理模型的错误率大幅增加。
OnlyFans 网红让 AI 分身 24 小时营业,躺赚收入还更多,新创作时代来了
AI 在音乐、影视制作、直播等领域开始替代人类创作。AI 生成工具帮助普通人创作音乐、视频和内容,提高了效率和便捷性。AI 数字分身则在私密场景中提供情感交流服务。但 AI 的出现也引发关于真实互动消失的讨论,未来的内容生产和消费可能会发生改变。
喝点VC|a16z最新洞察:滞后性市场调研的时代正在终结,AI驱动创企正重塑组织获取客户洞察、制定决策和大规模执行的方式
成了持续、动态的竞争优势。
我们用
AI
来访谈、分析、模拟客户,调研不再依赖人工流程,而是嵌入到工
2050年,衰老将被攻克?合成生物学教父揭秘长寿未来!
George Church探讨了基因技术在未来可能的应用,包括逆转衰老、复活灭绝物种及开发生物机器人。他预测到2050年,人们或将能通过体细胞疗法逆转部分衰老迹象,并关注AI和生物学融合的前景。
Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率,华为诺亚提出代码HLCE终极基准
本文介绍了华为诺亚实验室发布的’人类最后的编程考试'(HLCE)基准测试,旨在评估当前大语言模型(LLM)在复杂编程任务上的表现。结果显示,即使是顶尖的大模型,在HLCE上也面临巨大挑战,单次尝试成功率仅15.85%或11.4%,与其它基准相比显著降低。研究发现LLM擅长推理但对交互式问题不足,且存在自我认知能力不强的问题。总体而言,尽管在测试时扩展规律上表现良好,LLM仍需进一步优化。
Gemini CLI 重磅更新:现已支持音视频处理,并带来多项体验升级
Gemini CLI 更新支持音视频输入、增强Markdown功能,并引入VSCodium和Neovim集成。还提升了技术栈,增加了隐私管理功能及网络支持。
从诡异视频到假论文,AI正把互联网变成巨型「垃圾场」
AI 生成的诡异视频在社交媒体上大行其道,不仅有色情内容,还有涉及人身伤害、恐怖谷效应等伦理问题。学术领域亦受到冲击,AI 伪造论文导致科学信息虚假。呼吁警惕 AI 技术带来的负面影响,避免互联网变成信息垃圾场。