吊打ChatGPT,脚踩Claude:DeepSeek 自我介绍
大模型已成为中国AI研究主流。DeepSeek在中文语义处理方面表现出色,成功翻译了俄罗斯教授的经济学导论。DeepSeek还提供了文本生成、分类与情感分析、问答系统等多样的功能。
大模型已成为中国AI研究主流。DeepSeek在中文语义处理方面表现出色,成功翻译了俄罗斯教授的经济学导论。DeepSeek还提供了文本生成、分类与情感分析、问答系统等多样的功能。
优质的AI教学资源稀缺。清华NLP实验室等机构联合推出大模型公开课及教材《大语言模型》,覆盖全流程技术并配有配套代码与工具包,适合各类读者学习。新年之际发放十本电子版《大语言模型》作为福利。
微软开源 phi-4 模型,仅 14B 参数但性能媲美 GPT-4;Huggingface、Ollama 等已同步支持使用;技术报告和量化版本信息提供。
DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base,性能优于多个竞品模型,编程能力大幅提升。
HuggingFace发布文本生成推理引擎TGI v3版本,性能大幅提升:在单个L4显卡上处理30k token lama 3.1-8B模型输入成为可能。与vLLM相比,在超长文本处理方面快了13倍。通过优化内存管理、改进前缀缓存结构和开发新的推理内核,TGI v3实现了零配置的极致性能。
蚂蚁技术研究院开源的AI图像编辑工具MagicQuill,让用户通过简单的画笔涂抹和提示词快速实现智能化、精细化的复杂图像编辑任务。该工具结合了“编辑处理器”、“绘画助手”和“创意收集器”三大功能,支持添加、删除和上色等多种操作。