2025年7月9日8时 - 第7页共7页

Qwen3 8B 的 BitNet 版本

2025年7月9日8时作者 NLP工程化

Qwen3-8B-BitNet是基于Qwen3-8B进行微调的模型，使用Prime Intellect的SYNTHETIC-1数据集，并在每个线性层输入中添加RMSNorm，所有线性层已转换为BitNet。该模型大小压缩至2.5B左右。

一份系统性的 LLM 微调实战指南：FineTuningLLMs

2025年7月9日8时作者 NLP工程化

详细介绍了量化、LoRA 适配器、数据格式化等核心技术，并分享了在单个 GPU 上高效微调大语言模型的方法和实践案例。

一个第三方魔改的DeekSeek模型，省流：性能比V3好，速度比RI快

2025年7月9日8时作者 NLP工程化

DeepSeek-TNG-R1T2-Chimera 是一种专家混合体语言模型，由三种父模型组装而成，相比前代有更快的推理速度和更好的一致性表现。

5.4K Star蓝牙通讯革命！火爆 GitHub 的去中心化通信神器 BitChat 开源了！

2025年7月9日8时作者开源星探

BitChat 是一款基于蓝牙的去中心化聊天应用，支持iOS/macOS系统。它采用端到端加密、自动中继转发等功能，实现了离线通信和隐私保护，目前已有5.4K Star。

ChatGPT正测试神秘功能

2025年7月9日8时作者 AIGC开放社区

ChatGPT测试新功能‘Study Together’以提升教育应用质量并减少被滥用的可能性。

英伟达、港大等发布创新KV缓存，实现扩散模型无训练加速

2025年7月9日8时作者 AIGC开放社区

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态。扩散语言模型通过存储和重用先前计算的注意力状态来提升生成速度，但并行解码时往往导致生成质量下降。Fast-dLLM提出基于置信度的平行解码策略来改善这一问题。

Hugging Face开源顶级模型：双模式推理+128K上下文，最强3B

2025年7月9日8时作者 AIGC开放社区

展和
应用
落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！
今天凌晨，全球著名大模型开放

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31