资讯
news
Andrej Karpathy:我们需要让大模型“上学”,强化学习才刚开始
Andrej Karpathy 比喻训练大型语言模型 (LLM) 过程像教育学生,提出了背景信息、例题及解答与练习题对应预训练、监督式微调和强化学习的概念。他强调了提供大量背景知识、示范性例子以及实践练习的重要性。
吴恩达评DeepSeek:中国 AI 崛起,开源模型重塑行业格局
DeepSeek发布R1模型引发关注,中国生成式AI正赶超美国。开源权重模型降低了基础模型的成本,推动了更多应用开发机遇。Qwen、Kimi等模型展示了AI领域的发展与潜力。
AI 科研重大升级!OpenAI宣布携手美国国家实验室,为15000名科学家送上科研利器
OpenAI宣布与美国国家实验室合作,利用最新推理模型加速科学突破。合作将重点聚焦基础科学研究、疾病治疗、网络安全等领域,并将在洛斯阿拉莫斯国家实验室的超级计算机上部署。
OpenAI最新爆料:「满血版」o3明天发?!
OpenAI首席全球事务官Chris Lehane透露,o3模型将于本周五正式上线。同时,OpenAI计划与美国国家实验室合作提供先进模型,并计划融资400亿美元加强基础设施支持。
一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起
美国科技大厂和初创公司争相部署DeepSeek-R1,中国AI正崛起并重塑行业格局。吴恩达认为开放权重模型将推动基础模型层商品化,减少模型训练成本,加速技术普及。
19岁华人辍学创业,刚刚拿下百万美金融资!All in智能体,誓要实现Siri初心
19岁辍学创业的Dawson Chen和Ethan Hou,开发出AI助手Martin,并获得200万美元种子轮融资。Martin采用自定义记忆架构,能处理日常任务、日程管理等需求,目标成为最贴近消费者生活的AI智能体。