阿里千问携手DeepSeek引领国产开源大模型走向世界
阿里千问开源Qwen2.5-VL-32B-Instruct,提升视觉语言能力与数学推理。相比同类模型,其在多模态任务中表现显著优势,且在同规模纯文本能力上也取得顶级表现。
阿里千问开源Qwen2.5-VL-32B-Instruct,提升视觉语言能力与数学推理。相比同类模型,其在多模态任务中表现显著优势,且在同规模纯文本能力上也取得顶级表现。
一款名为PDF Craft的开源工具专注于将扫描书籍的PDF文件转化为Markdown或EPUB格式,支持本地AI模型运行核心功能和远程调用LLM处理复杂任务,具有高效、精准、隐私友好等特点。
谷歌最新发布的Gemini 2.5 Pro模型在推理和代码能力上表现优异,横扫多个基准测试排行榜榜首,并且实现了显著的性能提升。
OpenAI 推出GPT-4o模型集成先进图像生成器,支持多模态输入输出、理解复杂指令等新功能,并向用户开放使用。
专注AIGC领域的专业社区分享了OpenAI GPT-4和Sora的新更新,特别是文生图模型的能力增强,包括逼真度高、支持自定义操作等功能。文章展示了几个实际生成的案例,如奇幻世界和人体结构介绍图,并提及OpenAI联合创始人Sam Altman对这一新模型的高度评价。
专注AIGC领域的专业社区,关注大语言模型的发展和应用落地,聚焦市场研究和开发者生态。研究人员揭示了高推理努力配置的大模型在执行任务时的过度思考问题,并提出减轻过度思考的方法提高了效率并降低了成本。
百度近期在AI领域动作频频,推出秒哒平台让开发者能快速开发H5、网站等应用。该平台通过自然语言描述需求生成代码,集成多种智能体和工具实现高效开发。百度CEO李彦宏曾预测,这将使更多人成为‘程序员’,带来新的商业机会。