腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解
腾讯混元开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数80B,激活参数仅13B。模型已在GitHub和Huggingface上线,并正式支持接入部署。这是业界首个13B级别的MoE开源混合推理模型,其在多个权威数据测试集上表现优异,在实际使用场景中可以根据需要选择思考模式。
腾讯混元开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数80B,激活参数仅13B。模型已在GitHub和Huggingface上线,并正式支持接入部署。这是业界首个13B级别的MoE开源混合推理模型,其在多个权威数据测试集上表现优异,在实际使用场景中可以根据需要选择思考模式。
上海交通大学团队提出ITFormer,通过高效桥接时序数据和大语言模型,实现航空发动机运维中的即插即用特性,并在EngineMT-QA数据集上取得优异性能。
Crossing Minds,一家致力于为电子商务企业提供AI推荐系统的初创公司,宣布其团队将加入OpenAI。该公司已获得多轮融资超过1350万美元,并通过研究顾客行为数据提供个性化和推荐系统优化服务。联合创始人表示希望融入OpenAI的使命:确保通用人工智能造福全人类。
OpenAI 开始租用谷歌 TPU 芯片支持 ChatGPT 及其产品,这是 OpenAI 首次采购非英伟达芯片,可能对其与微软的关系和对 Google 的依赖产生影响。
阿里发布Qwen-VLo多模态模型,具备增强细节捕捉能力、一句指令图像编辑及多语言支持。其不仅能连续生成图片,还能识别解释图像内容,并进行注释和分割。实测显示其生图效果令人满意。