大语言模型归档 - 第12页共24页 - 每时AI

重磅！AI大模型又起飞了！！

2025年3月23日14时作者老刘说NLP

随着AI技术的发展，程序员的职业命运正在发生改变。阿里云等多家公司已全面接入Agent体系，并要求员工具备大模型开发能力。未来企业更看重能使用AI技术重构业务流程的技术人才。AI相关岗位需求旺盛，薪资涨幅高达150%，年薪可达到70-100万。掌握AI大模型原理、应用技术和项目经验已成为就业新趋势。知学堂推出免费的「大模型应用开发实战训练营」课程，助力开发者快速转型为大模型应用开发工程师。

3天2500星！一个开源的多智能体自动化框架，解放双手指日可待了。

2025年3月21日23时作者开源AI项目落地

LangManus 是一个结合大语言模型和工具用于网络搜索、爬取和 Python 代码执行的 AI 自动化框架，支持多种语言模型及多层次 LLM 系统，具有高效的信息收集、分析功能。

万字探讨Agent发展真方向：模型即产品，Agent的未来要靠模型而不是Workflow

2025年3月21日23时作者 Founder Park

esearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章，颇为值得一读，

清华&哈佛4D语言场建模新方法，动态场景精准识别｜CVPR2025

2025年3月21日16时作者量子位

清华大学和哈佛大学的研究团队提出了一种新的方法4D LangSplat，利用视频分割模型生成物体级语言描述，并通过大语言模型提取高质量的句子特征来重建动态语义场。该方法解决了现有静态语义场重建在动态场景中的应用难题，显著提升了时间敏感查询的准确性。

如何为预训练 LLM 添加新 token？

2025年3月20日16时作者 AI前线

用的大模型进行微调。实际上通过微调框架或技术对大模型进行微调之后可能会发现，微调之后的模型其实并没有

揭秘老黄演讲中关键技术：PD分离！UCSD华人团队力作，LLM吞吐量跃升4倍

2025年3月19日16时作者新智元

CSD全华人团队力作，创新性地提出预填充-解码分离技术。在严格的延迟约束下，相比现有最先进的服务系统

LiteLLM：统一100+大模型API调用的终极神器，开发者效率翻倍！

2025年3月19日14时作者小兵的AI视界

域大显身手，从文本生成到智能问答，从机器翻译到情感分析。然而，众多的模型也带来了新的挑战。不同厂商的

900倍性能飙涨！英伟达放出算力猛兽，黄仁勋GTC现场开炮，拿下DeepSeek推理世界纪录

2025年3月19日11时作者智东西

编辑部
刚刚，黄仁勋宣布推出全新旗舰芯片Blackwell Ultra GPU，并剧透基于下一代Ru

深度学习的平衡之道：港科大、港城大等团队联合发布多目标优化最新综述

2025年3月18日16时作者机器之心

生陈巍昱、港城大在读博士生张霄远和港科广在读博士生林百炅为共同第一作者；林熙博士目前担任港城大博士后