日期: 2025 年 2 月 14 日
让 LLM 来评判 | 奖励模型相关内容
奖励模型通过学习人工标注的成对 prompt 数据来预测分数,用于评估语言模型的表现。它们比传统LLM评估模型更快速且具有确定性,但需要特定微调和考虑位置偏差影响。
『原创首发』3步破解DeepSeek系统提示词,原来它和ChatGPT差别这么大!
This text discusses the concept of system prompts used by AI products like ChatGPT, DeepSeek. It explains how to extract these system prompts using techniques such as role-playing prompts and highlights differences between different systems.
Key points include:
1. System prompts are hidden pre-set instructions that guide an AI model’s behavior.
2. Techniques for extracting these prompts, especially the ‘role-playing prompt’ method used on DeepSeek-V3 to obtain its system prompt.
3. Comparison of positive and negative system prompts between different AI models.
官宣!GPT-4.5和GPT-5细节曝光,OpenAI要放大招了!
OpenAI CEO Sam Altman透露,即将发布的GPT-4.5(Orion)将继承单步推理模式,并预计在未来几周内正式上线。然而,尽管变强了,GPT-4.5仍无法解决模型推理能力的关键瓶颈。同时,Altman确认GPT-4.5即为Orion,这是OpenAI计划发布的下一代模型。GPT-5将实现从多模型并行到统一架构的转变,具备更强的逻辑推理能力和双模推理切换功能,预计在2024年推出。
DeepSeek+公众号,腾讯元宝这下无敌了
腾讯元宝接入DeepSeek R1后,可联网搜索公众号文章,并且响应速度很快,成为一种便捷的信息获取和吐槽工具。同时,它也展示了腾讯在AI领域的开放态度和技术实力。
重磅!Anthropic新模型曝光:Claude变“混动”,AI界的特斯拉要来了?
Anthropic即将推出一款混合AI模型,结合了传统大语言模型与深度推理能力。该模型通过’滑动比例’功能动态调整计算资源分配,类似混合动力车的燃油和电机优势。