新智元
李飞飞、DeepSeek为何偏爱这个国产模型?
阿里云通义千问的Qwen模型在短短时间内取得了显著突破,仅用1000个样本在H100上监督微调26分钟就训练出与顶尖推理模型相当的新模型s1-32B。这一成果引起了AI社区的关注和赞誉,取代了Llama成为开源AI社区的重要标杆基座模型。
架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练
新智元报道,清微智能基于可重构计算架构推出RPU芯片,实现了千亿级参数模型的高效运行和部署,解决了大模型时代算力成本与效率之间的矛盾,助力国产AI芯片性价比提升。
GPT-4o多模态核心大佬离职OpenAI!联创Schulman跳槽前CTO初创
OpenAI多模态团队负责人Alexander Kirillov离职,而前CTO Mira Murati创立的初创公司迅速招揽Kirillov加盟。此消息引发对OpenAI内部动荡的担忧。
突发!o3-mini思维链公开,却被曝光全是「作假」,奥特曼现身解释网友炸锅
OpenAI公开了o3-mini的思维链功能,但后续发现并非原始CoT。OpenAI研究员表示,他们正在努力整理原始的CoT并提供翻译,以保持内容的忠实度。
今天起,ChatGPT搜索人人可用!OpenAI疯狂砸钱,雇300+博士为AI打工
ChatGPT搜索今日全面开放,无需注册登录。功能与传统搜索引擎相似,支持图片和链接展示,并标明信息来源。OpenAI在搜索领域的动作引发了市场关注,正蚕食传统搜索引擎市场份额。