HuggingFace
DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星
Open R1项目由HuggingFace发起,旨在复制DeepSeek-R1模型。该项目通过三个步骤实现这一目标,并借助官方技术报告进行指导。
吊打ChatGPT,脚踩Claude:DeepSeek 自我介绍
大模型已成为中国AI研究主流。DeepSeek在中文语义处理方面表现出色,成功翻译了俄罗斯教授的经济学导论。DeepSeek还提供了文本生成、分类与情感分析、问答系统等多样的功能。
23 年爆火的大模型综述,如今出纸质书了丨文末送书
优质的AI教学资源稀缺。清华NLP实验室等机构联合推出大模型公开课及教材《大语言模型》,覆盖全流程技术并配有配套代码与工具包,适合各类读者学习。新年之际发放十本电子版《大语言模型》作为福利。
最强小模型phi-4开源上架huggingface,并同步登陆Ollama
微软开源 phi-4 模型,仅 14B 参数但性能媲美 GPT-4;Huggingface、Ollama 等已同步支持使用;技术报告和量化版本信息提供。
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base,性能优于多个竞品模型,编程能力大幅提升。
TGI v3 横空出世:性能碾压vLLM 13倍!
HuggingFace发布文本生成推理引擎TGI v3版本,性能大幅提升:在单个L4显卡上处理30k token lama 3.1-8B模型输入成为可能。与vLLM相比,在超长文本处理方面快了13倍。通过优化内存管理、改进前缀缓存结构和开发新的推理内核,TGI v3实现了零配置的极致性能。
蚂蚁技术研究院最新开源:AI P图神器MagicQuill
蚂蚁技术研究院开源的AI图像编辑工具MagicQuill,让用户通过简单的画笔涂抹和提示词快速实现智能化、精细化的复杂图像编辑任务。该工具结合了“编辑处理器”、“绘画助手”和“创意收集器”三大功能,支持添加、删除和上色等多种操作。