vLLM 获十倍增长!2025目标:单卡吊打GPT-4o
小小vLLM在2024年下半年部署GPU使用时长增长10倍。它在GitHub上的星标数量、贡献者数量、月下载量分别增长了2.3倍、3.8倍和4.5倍,支持多种模型架构及硬件平台。计划实现单GPU运行GPT-4级别模型,并将量化、前缀缓存等功能标配。
小小vLLM在2024年下半年部署GPU使用时长增长10倍。它在GitHub上的星标数量、贡献者数量、月下载量分别增长了2.3倍、3.8倍和4.5倍,支持多种模型架构及硬件平台。计划实现单GPU运行GPT-4级别模型,并将量化、前缀缓存等功能标配。
Sam Altman透露了OpenAI的新模型o3-mini性能不及o1 pro的消息,并暗示OpenAI正酝酿将GPT系列与O系列合并。同时,有内部消息表明OpenAI计划在2025年推出一个更强大的AGI版本。这些信息引发了广泛的讨论和担忧,包括技术垄断风险、公民监督需求以及潜在的伦理问题等。
OpenAI发布的新模型GPT-4b micro在干细胞研究领域取得重大突破,其效率提升50倍。该模型背后有更大的野心,包括构建AGI(通用人工智能)以及加速科学发现和创新。
Sam Altman 回应参议院质疑OpenAI百万捐款时称这是个人行为,引发网友热议。科技巨头在选举后向特朗普就职基金捐赠数百万美元,引起质询。Altman认为这与公司无关,而民主党捐款则无需如此关注。话题引发了关于是否存在双重标准的讨论。
传统的软件工程正在终结,AI时代需要系统思维者和自动化编排者。技术评估标准崩塌,软件开发正经历一场静默革命,走向工业化。软件已进化为体验编排的基础设施,重塑了我们的沟通方式、人际关系及情感承受力。面对变革,程序员需重新定位并积极适应新技术。
Riley Coyote在社交媒体上透露OpenAI可能已经达到了AGI第4级。这引发了科技圈广泛讨论,有人担忧超级智能系统可能会基于不真实的数据训练而带来的潜在风险。
微软发布的新材料生成模型MatterGen能够直接根据需求生成新材料,避免了传统试错实验。它使用扩散模型从随机结构开始调整原子位置、元素种类和周期晶格来生成新材料。该模型还可以根据多种属性条件进行条件生成,目前已开源用于研究和实际应用。
Cursor宣布完成1.05亿美元B轮融资,已成为数百万工程师首选编辑器。联合创始人表示要实现代码自动化面临三大研究问题:代码库理解、下一步编辑预测以及软件智能体。用户对其功能及团队规模扩张表达了认可和兴趣。