一手实测让马斯克睡帐篷的Grok4,DeepSeekR2又多一位可笑的对手
马斯克的Grok4发布会因推迟和低效表现引发关注。尽管新套餐价格高昂,但其在数学、物理等领域表现亮眼,但在代码编写和多模态任务上存在局限性。作者分享了使用基础版Grok4的经验,并提出了一些改进意见。
马斯克的Grok4发布会因推迟和低效表现引发关注。尽管新套餐价格高昂,但其在数学、物理等领域表现亮眼,但在代码编写和多模态任务上存在局限性。作者分享了使用基础版Grok4的经验,并提出了一些改进意见。
Grok 4现已对X Premium+订阅者开放,性能超越了包括OpenAI o3、Google Gemini等在内的多个领先模型,在关键测试中得分高达73分,并在人类最后的考试上取得50.7%的成绩。
MiniMax语音通过音色设计功能生成罗辑、庄颜等角色的个性音色,并开源了多个常用人物的声音链接。模型具有极强的泛化能力,可自定义任意语言、口音和音色,满足用户需求的同时保证版权安全。
持续强化学习(CRL)作为一种有前景的研究方向,旨在使智能体在动态、多任务环境中持续学习、适应并保留知识。CRL面临的主要挑战包括可塑性、稳定性及可扩展性。文章提出了一种新的分类体系,将CRL方法按照所存储和/或转移的知识类型分为四大类:基于策略的、基于经验的、基于动态的方法和基于奖励的方法。
本公众号介绍了一种基于Qwen2.5VL-3B模型微调的复杂表格解析工具OCRFlux。它支持HTML格式表示复杂表格结构、多列布局处理、跨页表格合并以及多语言文档解析。
法国AI研究机构Kyutai Labs开源最新文本转语音技术Kyutai TTS,支持实时交互场景,性能卓越,已在GitHub和Hugging Face开放源码与模型权重。