AI先锋官，作者每时AI - 第4页共18页

DeepSeek节前又双叒叕搞事，R1“小版本试更新”代码能力实测堪比Claude 4

2025年5月29日19时作者 AI先锋官

DeepSeek官方近日宣布已完成DeepSeek R1模型的小版本试升级，并在HuggingFace上开源了新版本。该模型在代码生成方面提升显著，性能接近OpenAI的模型且超越Claude-4-Sonnet，但推理能力稍有不足。

《滕王阁序》AI率100%，当机器开始审判人类毕业论文

2025年5月28日14时作者 AI先锋官

今年毕业季，高校和大学生们面临论文AI率问题的困扰。检测系统判定多篇论文高度疑似AI生成，引发热议与质疑。

Anthropic发布Claude 4：工程师级AI，而不是更聪明的搜索框或对话机器人

2025年5月23日14时作者 AI先锋官

Anthropic联合创始人Dario Amodei在Code with Claude开发者大会上表示，Claude正式进入全链条开发力和标准构建的全新竞争时代。旗舰模型Claude Opus 4延续了推理、代码能力方向，并且表现出色。新功能如‘思维摘要’与‘扩展思维’模式提升用户满意度。API定价及安全级别显著提升，为更多行业提供可靠支持。

这道推理题让所有AI大模型集体翻车

2025年5月21日14时作者 AI先锋官

在Reddit上出现了一道关于立方体的推理题，多个AI模型未能正确解答。最终通过提示“最长的可见边长应该是5个小正方体”，阶跃AI给出了正确的答案125-46=79个立方体。

一场危险的实验!AI水军卧底论坛4个月，洗脑100多人，说服率6倍于人类

2025年5月14日19时作者 AI先锋官

研究团队在Reddit的r/changemyview（CMV）版块进行了一场未经授权的实验，使用多个AI账号伪装成人类用户参与讨论。结果显示，这些AI机器人发表的评论能够说服社区用户改变观点，并且其成功率是人类基线水平的3-6倍。

告别英伟达？华为昇腾NPU跑出准万亿参数大模型，媲美DeepSeek R1

2025年5月9日19时作者 AI先锋官

华为盘古团队在昇腾 NPU 上高效训练了7180亿参数的 Pangu Ultra MoE 混合专家模型，并提出多项优化方案，提升计算资源利用效率，实现30.0%的模型算力利用率。

OpenAI开刀治理GPT-4o “舔狗”病

2025年5月9日14时作者 AI先锋官

就在前不久，GPT-4o突然出现过度谄媚的问题。用户反馈其回复内容充满无脑赞美，甚至只是简单打招呼也能得到夸赞。OpenAI随即回滚了版本并承认这一问题影响用户体验和信任。

小米开源MiMo模型，称性能超阿里QwQ-32B-Preview及OpenAI o1-mini

2025年5月6日19时作者 AI先锋官

小米发布首个为推理而生的大模型MiMo，仅7B参数规模超越OpenAI和阿里Qwen。技术团队强调预训练与后训练协同优化的重要性，通过特定数据合成及创新算法提升推理能力。

OpenAI也开始“带货”了

2025年5月1日14时作者 AI先锋官

OpenAI推出ChatGPT购物功能，支持用户直接在对话中进行商品搜索和购买。新功能不包含广告植入，确保推荐的中立性。下一步将整合记忆功能提供个性化产品推荐。