NLP工程化
即将发布 QwQ-Max 的正式版本
Qwen发布了QwQ-Max-Preview模型,该模型基于Qwen2.5-Max推理模型,具有更强的数学理解、编码和代理能力。即将发布QwQ-Max正式版,并在Apache 2.0下开放源代码。
Claude 3.7 Sonnet信息卡:Claude 3.7 Sonnet 是一款混合推理模型
Claude 3.7 Sonnet 是一款混合推理模型,重点在于减少潜在伤害,通过训练和周边安全系统进行评估。
FlashMLA,这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核
FlashMLA是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,已在多个配置下实现高吞吐量和峰值性能。
Zotero-arxiv-workflow:为Zotero用户管理arXiv论文提供高效解决方案
Zotero-arxiv-workflow:为用户自动合并arXiv预印本和期刊发表版本,一键更新最新信息和PDF。