刚刚,LMArena最新模型榜单出炉!DeepSeek-R1网页编程能力赶超了Claude Opus 4
DeepSeek 更新其R1推理模型至0528版本,提升性能并参加LMArena大模型公共基准测试平台的排行榜,DeepSeek-R1(0528)在文本、编程、数学等多个领域排名领先。
DeepSeek 更新其R1推理模型至0528版本,提升性能并参加LMArena大模型公共基准测试平台的排行榜,DeepSeek-R1(0528)在文本、编程、数学等多个领域排名领先。
Keller Jordan介绍其优化器Muon,用于神经网络隐藏层参数优化,在NanoGPT和CIFAR-10应用中显著提高训练速度,并与原文献链接。
小红书大模型 dots.llm1 已经被 llama.cpp 支持,本地用户可以使用 llama.cpp 作为推理引擎生成小红书风格内容。
PDF等非结构化数据精准地转换成结构化数据(如Markdown、JSON)已成为行业待解决的关键问题
AI教父Hinton为了给有学习障碍的儿子攒养老钱,将自己的神经网络公司卖给谷歌。但正是这次经历让Hinton意识到AI的潜在风险,并开始成为警告AI风险的先知。
专注AIGC领域的专业社区报道,Glean宣布完成1.5亿美元F轮融资,估值增长至72亿美元。由Wellington Management领投,多家现有投资者跟投。Glean是2022年成立的企业级搜索平台公司,利用AI技术提升企业搜索结果的准确性,增强个人和公司流程自动化。