重磅!Devin 终于问世,月薪3500的超强程序员!
Cognition Labs发布全球首个AI软件工程师Devin,每月500美元。但它不仅处理前端bug、创建PR、重构代码,还能独立开发加密货币。有人认为这终结了程序员职业,但开发者指出其仍需人类决策和协作能力。
Cognition Labs发布全球首个AI软件工程师Devin,每月500美元。但它不仅处理前端bug、创建PR、重构代码,还能独立开发加密货币。有人认为这终结了程序员职业,但开发者指出其仍需人类决策和协作能力。
HuggingFace发布文本生成推理引擎TGI v3版本,性能大幅提升:在单个L4显卡上处理30k token lama 3.1-8B模型输入成为可能。与vLLM相比,在超长文本处理方面快了13倍。通过优化内存管理、改进前缀缓存结构和开发新的推理内核,TGI v3实现了零配置的极致性能。
当AI生成视频遭遇体操,OpenAI的Sora只能勉强及格。体操运动成为AI视频生成「终极挑战」,因为包含了复杂的身体控制、运动轨迹和物理规律。尽管已有进步,但距离完美还有很长的距离。
清华大学和ModelBest Inc最新研究发现大模型「密度」每3个月就翻一倍,提出容量密度衡量新标准。未来AI发展的关键不再是比拼模型大小,而是看其效率。ChatGPT发布加速了这一趋势。高密度模型能降低计算成本、适配普通设备并节约能源。研究强调应关注现有大模型的优化而非一味追求更大模型。
比特币面临量子计算威胁。Google发布的Willow芯片展示了量子计算的巨大潜力。要破解比特币加密需要约1300万量子比特的计算机,而当前技术尚无法实现。虽然距离目标还有很长的距离,但量子计算的发展速度令人担忧。
ARC-AGI基准测试的创始人François Chollet宣布将升级ARC-AGI基准测试,在2025年初发布ARC-AGI-2。因为当前版本的一半测试数据已经失去了评估AGI的意义,新版本将扩大评估数据集规模、采用独立的评估流程及任务难度均衡,以提供更可靠的评估标准。
美国联邦政府运行着10个关键遗留系统,其中最老的已有51年历史。这些系统的维护费用每年高达3.37亿美元,使用过时技术且存在严重安全隐患。GAO报告显示,美国政府在IT预算中的80%被用于维持这些系统的运行。
通过双模型编程工作流,利用o1 Pro和Claude 3.5 Sonnet处理代码小修小补及新功能开发。Sonnet犯难时由o1 Pro解决,创新功能需反复讨论生成伪代码再转为实际代码。