机器学习
实证:现在的LLM根本不会Reasoning!
MLNLP社区致力于推动国内外自然语言处理领域的学术与行业发展。最新论文指出,热门的大推理模型可能只是在’表演思考’。该论文通过特定谜题揭示了这类模型的问题复杂度上限,并提出了改进方向。
阿里巴巴开源增强Agent搜索能力预训练框架,AI代码生成助手:Code Puppy
五个项目介绍:MaskSearch增强智能体通用搜索能力、RoboBrain 2.0提升机器人具身智能能力、AlphaOne优化大语言模型推理速度、Code Puppy作为AI代码生成助手以及Mevzuat MCP简化土耳其法律法规访问。
解锁文档处理新高度!这个开源神器支持OCR+机器学习,超丰富的API接口,效率翻倍!
Dedoc是一款ISPRAS团队开源的文档提取与转换工具,支持多格式文档处理,包括Office、PDF和扫描件等,并能智能提取表格、文本格式和逻辑结构。其核心功能亮点涵盖文档逻辑结构提取、复杂表格解析以及OCR扫描件处理。
速递|AI会计系统Rillet获红杉领投2500万美金,AI总账助力企业月结提速至小时级
Rillet 完成 2500 万美元 A 轮融资,红杉资本领投。该公司利用机器学习和 AI 实现会计报告自动化,能在数小时内生成核心财务报表。其软件帮助中型企业在短时间内完成月度或季度结账,显著减少了对 NetSuite 的依赖。
40位数学家组成8队与o4-mini-medium比赛,6队败北
在FrontierMath基准测试中,O4-mini-medium击败了由数学专家组成的团队。尽管AI尚未达到超人水平,但有观点认为它很快就会超越人类。