月度归档: 2025 年 4 月
苹果Siri团队“大换血”,抽调Vision Pro技术骨干
苹果公司重组Siri工程团队,引入Vision Pro骨干成员加速AI技术迭代。新任主管Mike Rockwell调整架构并换血,试图扭转Siri在AI领域的劣势。
ICLR 2025 Oral 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择
本文通过最优控制理论建立起数据选择与训练动态之间的数学联系,为理解预训练数据的价值提供了理论抓手。这一方向不仅有望替代传统依赖直觉与试验的数据筛选流程,也为未来自动化、可解释的大模型训练打开了新思路。
曝谷歌或被强拆!OpenAI趁机欲收购Chrome
OpenAI高管透露,若谷歌出售Chrome浏览器,公司有意收购;已与苹果达成收入分成协议。美国司法部建议强制拆分Chrome,开放搜索数据将提升ChatGPT产品竞争力。
一天拿下3.4k star,这个1.6B开源模型火了,合成对话超逼真
机器之心报导,Dia-1.6B 是一个在 GitHub 等平台上走红的开源语音模型,不仅能生成说话的声音、对话,还能合成真实感强的各种声音。其参数量为1.6B,目前已被下载超过5600次,热度排名Hugging Face第二,已收获大量好评和星标。
围观!斯坦福最火AI课全球免费开讲,顶级大佬亲授Transformer精髓,课表全放送
斯坦福推出免费在线课程CS25: Transformers United V5,涵盖Transformer架构及其应用,包括语言模型、强化学习、AGI等前沿话题。
藏师傅的网页生成提示词 3.0| 原来 Gemini 2.5 Pro 这么强
文章介绍了如何使用Gemini APP中的提示词将特斯拉财报文档生成网页。通过HTML、TailwindCSS3.0+和Framer Motion等技术实现网页动态效果,模仿苹果官网风格,并提供了Bento Grid设计风格的具体应用技巧。
沉浸式翻译再发神器,PDF翻译终极解决方案,重要的是依然良心
沉浸式翻译工具BabelDOC支持精准翻译PDF内容并保持原排版,能处理复杂图表、公式等非文本元素。它解析PDF结构,并智能匹配字体和行距以确保译文无缝替换原文内容。免费用户每月享有1000页的翻译额度。