跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

安全性

ICLR 2025 大模型“遗忘”竟是错觉?华南理工团队首次揭示LLM训练中的“虚假遗忘”

2025年2月4日16时 作者 PaperWeekly

近年来,大型语言模型(LLMs)在诸如
安全对齐
、
指令微调
等领域均取得了卓越表现。然而,在对这

分类 大模型、 学术 标签 AlignedLanguageModels、 Fine-tuning、 ICLR2024、 Qi、 TRACE、 安全性 1 条评论

o3-mini 和 DeepSeek-R1:哪一个更安全?

2025年2月1日14时 作者 PaperAgent

OpenAI发布的新模型o3-mini在安全性方面表现较好,相比之下DeepSeek R1存在较大问题。实验结果显示o3-mini仅1.19%的回答被认为是不安全的,而DeepSeek-R1则有11.98%的回答被归类为不安全。

分类 分享 标签 1.19%、 DeepSeek R1、 o3-mini 模型、 安全性、 研究学者、 金融犯罪 发表评论

DeepSeek-R1直接把提示工程师的饭碗整没了

2025年1月29日22时 作者 PaperAgent

DeepSeek-R1不再接受复杂的提示工程,改用简洁的大白话描述目标。同时公布了关于其安全使用的建议和部署策略。

分类 分享 标签 DeepSeek-R1、 安全使用、 安全性、 无需提示工程、 语言模型、 阿里巴巴云 发表评论

nesa:以端到端加密的方式运行 AI 模型,确保数据隐私和安全

2025年1月25日8时 作者 NLP工程化

以端到端加密方式运行AI模型确保数据隐私和安全(nesa)

分类 开源 标签 AI模型、 安全性、 数据隐私、 用户支持100、 端到端加密技术 发表评论

重磅!Anthropic CEO 称将于2025年推出数字员工!

2025年1月22日8时 作者 AGI Hunt

一个名为Virtual Collaborator的AI代理计划在2025年推出,该数字员工能够独立执行多种任务,如编写代码、通过Slack与同事沟通,并定期汇报进度。Anthropic强调其安全性和可控性。

分类 分享 标签 AI代理、 Anthropic、 CEO、 Virtual Collaborator、 安全性、 工作方式 1 条评论

视觉语言模型安全升级,还不牺牲性能!技术解读一文看懂|淘天MMLab南大重大出品

2025年1月17日12时 作者 量子位

PSA-VLM 投稿
量子位 | 公众号 QbitAI
模型安全和可靠性、系统整合和互操作性、用户交

分类 资讯 标签 PSA-VLM、 可控性、 可解释性、 安全性、 概念瓶颈架构、 社会价值 发表评论

企业级LLM独角兽 Cohere 发布 North:集成 RAG、搜索及 Agent 的企业级 AI 工作空间

2025年1月13日22时 作者 子非AI

Cohere
,一家领先的基础模型公司,近日发布了其最新的企业级 AI 平台
North
。
Nor

分类 分享 标签 Cohere公司、 North平台、 低代码平台、 安全性、 隐私保护、 集成性 发表评论

刚刚!世界最快GPU RTX 5090官宣售价超1.4万元,国行阉割版5090 D定价超1.6万元

2025年1月13日12时 作者 HyperAI超神经

作者:十九,李宝珠
编辑:李姝
转载请联系本公众号获得授权,并标明来源
英伟达 RTX 5090 正

分类 学术 标签 GPU配置、 RTX 5090 D、 外部资源、 安全性、 数据集、 隐私泄露 发表评论

Sam Altman:即便AI将带来人类灭绝,我们也先造了再说!

2025年1月12日8时 作者 AGI Hunt

打造潜在「灭世武器」的OpenAI,居然坚持「造了再说」!
在最新彭博社专访中,OpenAI的CEO

分类 分享 标签 AGI、 OpenAI、 Sam Altman、 安全性、 研究、 责任性 发表评论

重磅!Anthropic发布通往AI安全的6大技术路线图!

2025年1月11日16时 作者 AGI Hunt

AI安全研究迎来里程碑时刻!Anthropic公布重要提案,提出六大技术路线图以确保未来AI系统的安全。

分类 分享 标签 Anthropic、 Samuel Marks、 关键技术方向、 安全性、 监督体系、 研究路线图 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面4 页面5 页面6 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 10 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×