跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多层感知机

从零实现多层感知机

上午8时 2025/04/24 作者 NLP工程化

基于Eigen库的C++实现多层感知机(MLP),支持多种激活函数和损失函数,并采用小批量梯度下降与反向传播算法进行训练。

分类 开源 标签 Eigen库、 GitHub、 反向传播、 多层感知机、 小批量梯度下降、 模块化设计 发表评论

Claude团队开盒Transformer:AI大脑原来这样工作

下午11时 2025/03/28 作者 量子位

研究人员使用电路追踪方法揭示了大模型Claude的工作机制,包括其长逻辑推理、多语言处理和诗歌创作能力。

分类 资讯 标签 Claude团队、 交互式可视化、 多层感知机、 归因图、 电路追踪方法、 跨层编码器 发表评论

ICLR 2025 Spotlight SmODE: 神经常微分网络让深度强化学习的控制更加丝滑!

下午11时 2025/03/26 作者 极市干货

通过设计具有平滑特性的常微分方程作为神经元核心结构,构建平滑神经网络作为强化学习策略网络,显著提高

分类 学术 标签 Lipschitz常数、 SmODE、 低通滤波、 动作波动率、 多层感知机、 神经常微分神经网络 发表评论

揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷

上午11时 2024/11/26 作者 新智元

新智元报道
编辑:LRST
【新智元导读】
北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性

分类 资讯 标签 FAN 模型、 周期性建模、 多层感知机、 时间序列预测、 泛化能力、 符号公式表示 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 提示工程101第十五课:提示词长度与复杂度管理
  • MCP & RAG:赋能人工智能突破创新的完美组合
  • 谷歌神秘模型Kingfall泄漏!
  • 碾压PS,超越GPT4o:Flux Kontext超级P图
  • 为什么OpenAI们开始化身「购物狂」?

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×