NLP工程化
Ephe:一款极简的Markdown任务管理工具
Ephe:一款专注于简洁任务管理的Markdown工具,仅需一个页面帮助用户轻松整理日常任务和思绪,支持纯Markdown格式,本地存储确保数据安全。
Gwitter:一个基于 GitHub Issues 构建的轻量级微博应用
Gwitter 是一个基于 GitHub Issues 的轻量级微博应用,支持点赞、评论和动效展示,并提供国际化支持、响应式设计和多平台同步功能。
huggingface发布了3B参数里的SoTA模型 smollm3
Hugging Face 发布了3B参数的SOTA模型 Smollm3,支持Think/No-Think模式,默认不支持汉语,未来将发布其详细信息及构建方法。
一个第三方魔改的DeepSeek模型,省流:性能比V3好,速度比RI快
DeepSeek-TNG-R1T2-Chimera 是一种改进后的语言模型,通过融合多个父模型实现了更快的推理速度、更高的智能测试成绩和更好的一致性表现。相比前代版本,其在性能平衡方面有了显著提升,并特别适用于那些需要较快响应速度和良好一致性的场景。
一个基于 Rust 打造的高性能分布式存储系统:RustFS
Rust基因的高性能分布式存储系统RustFS,旨在成为MinIO的开源替代品,适用于海量数据存储等场景,具备内存安全、兼容S3、简单部署和国产化支持等特点。
Qwen3 8B 的 BitNet 版本
Qwen3-8B-BitNet是基于Qwen3-8B进行微调的模型,使用Prime Intellect的SYNTHETIC-1数据集,并在每个线性层输入中添加RMSNorm,所有线性层已转换为BitNet。该模型大小压缩至2.5B左右。