大模型
大语言模型
关于大模型智能体意图识别不准确问题——function call的缺陷
最近在研究大模型智能体过程中遇到的问题之一是意图识别不准确,影响了Agent的质量和效果。解决方法包括明确描述函数功能、使用多轮对话增强理解能力、利用分类模型进行意图识别及设置规则引擎兜底等。
谷歌免费王炸!Gemini 2.5 Pro 推理实测:正确率 100%,零幻觉!
谷歌最新发布的推理模型Gemini 2.5 Pro在多项基准测试中表现出色,尤其在数学、推理、多模态和长上下文方面。其性能领先于其他同类模型,并且具有自我验证的能力。实测结果显示,Gemini 2.5 Pro在一系列复杂的逻辑运算题目上均能正确解答,无一错误。
7倍推理加速!清华团队发布稀疏Attention,无需训练加速一切模型
清华大学陈键飞团队提出的SpargeAttn无需训练且通用,实现了任意模型在4-32K上下文长度上的4-7倍推理加速,并保持了端到端精度。该方法通过选择性地压缩Q, K矩阵并预测P矩阵来节省计算,同时使用稀疏在线softmax算法进一步优化。
从深度学习到科学模拟,A5000显卡成算法工程师新宠,这背后有何技术乾坤?
A5000 显卡凭借强大图形核心与多流处理器,在深度学习神经网络反向传播计算中大幅缩短训练时间。它在性能上虽稍逊 NVIDIA RTX 3090,但性价比极高,CUDA、Tensor和RT 核心数占比均达78%,FP32等性能接近。现正进行破价活动,A5000 24G GPU 最低 0.88 元/小时,新用户注册可获10元代金券,学生用户更有额外奖励。
OpenAI 重磅升级 GPT-4o:指令更准、代码更强,超越 GPT-4.5?
最近,OpenAI 推出的新模型 GPT-4o 价格高昂且性能升级显著。相比之下,DeepSeek 和谷歌的模型则更加实惠。更新后的 GPT-4o 在性价比、直觉和创造力等方面表现突出,但仍存在编程能力方面的不足。
Gemini 2.5、DeepSeek V3 免费用!这个神仙平台帮你一键PK所有AI模型!
最近推出的 DeepSeek-V3-0324 和 Gemini 2.5 Pro 成为免费 AI 模型新宠,OpenRouter 平台提供多达 369 个模型,包括 DeepSeek-V3-0324 和 Gemini 2.5 Pro,支持免费使用和 API 调用。
OpenAI和谷歌接力干掉Photoshop
谷歌Gemini 2和OpenAI的ChatGPT 4o发布新功能引发热潮。然而,AI重绘功能早在MJ、Stable Diffusion等项目中已有成熟技术,但由于LLM玩家习惯自然语言控制工作流而非直接指令生成,导致该功能未火。
ACM MM25地面卫星匹配大赛来袭!恶劣天气下的定位挑战,天空之眼助力精准导航
无人驾驶飞行器(UAV)在多媒体应用中越来越受欢迎,本次研讨会汇集研究人员探讨无人机视频处理、数据分析和群技术等最新进展。