月度归档: 2025 年 5 月
Linear-MoE:线性注意力遇上混合专家的开源实践
近年来,大语言模型的研究热点转向了线性序列建模和混合专家架构的高效结合。来自上海人工智能实验室团队的Linear-MoE首次系统地实现了这两者的结合,并开源了完整的技术框架,支持层间混合架构。
Artificial Analysis:DeepSeek成为世界前二AGI实验室
DeepSeek R1-0528版本超越xAI、Meta等成为全球第二大人工智能实验室,并与谷歌并列。其智能指数得分从60分跃升至68分,超过多个顶级模型,提升主要体现在数学竞赛、代码生成和推理方面。
搜攻略到凌晨3点?飞猪AI“问一问”用1张表谋杀废话
文章介绍了飞猪上的旅行Agent“问一问”,它能根据用户的详细需求生成实际可用的行程规划,并且提供了详细的地图、行程卡片和预算信息。用户可以通过该工具预订酒店和机票,甚至调整预算后生成新的方案。
[Triton编程][基础] Triton Fused Softmax Kernel详解: 从Python源码到PTX分析
562146477609112
编辑丨GiantPandaLLM
0x00 前言
Triton Fu
不能薅羊毛的旅行Agent不是好AI
上个五一用飞猪问一问规划了邮轮之旅后深感满意。新版本支持更多查询条件、上线会员助手,优化搜索能力。贵阳端午自驾游计划:选择大客机节省成本,会员系统提供优惠信息;行程可视化生成精美地图攻略并可导出分享;个性化对话功能帮助用户获得满意的行程建议。