Qwen2.5-VL-32B 更小更聪明!与grok、gemini同台打造“治愈老奶奶”,谁更强?

AI届’汪峰’Qwen团队发布Qwen2.5-VL-32B-Instruct,通过强化学习优化提升回答质量、数学推理能力及图像理解。性能超越多款模型,在MM-MT-Bench评估中优于Qwen2-VL-72B-Instruct。

OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达

阿里联合人大交大开源WritingBench评估基准,覆盖6大领域100个细分场景。通过四阶段人机协同流程构建评测集,基于写作意图动态生成评测指标,实现87%的人类一致性得分。团队发现带思维链模型在创意写作中表现更优,但长文本生成仍面临挑战。

一个框解决所有需求?如何用夸克AI超级框实现100个APP的生产力

夸克发布了AI超级框功能,可以直接调用阿里完善的工具基建完成任务。它在健康、影视、学术领域提供了专业的内容搜索,并支持 AI 编程和 PPT 设计等功能。同时拥有强大的模型生态,涵盖多模态信息处理与深度推理能力。

HuggingFace上的热门开源模型,一半都来自中国了

HuggingFace热门榜单显示中国大模型超过50%。DeepSeekR1和Qwen等模型因性能、实用性和稳定性提升而受欢迎,Apache 2.0/MIT许可协议提供法律确定性。开发者更偏好开源深度更高的中国模型,如Qwen系列支持多种参数规格及全面数据集。中国大模型已在OpenAI的Llama3之上或在某些任务上超越,其在部署门槛和性能方面均表现优异。