大型语言模型
录制用户操作简化RPA流程,实现浏览器自动化Workflow Use,DeepMind 的 AlphaEvolve 开源实现,
本文介绍了五款开源工具:Workflow Use简化RPA流程、OpenAlpha_Evolve利用进化算法发现自主算法、OpenManus无需邀请码即实现AI代理、BrowserBee结合LLM控制隐私优先的网页自动化任务,以及nanoDeepResearch从零构建ReAct智能体工作流。
探索AI新前沿:HuggingFace推出免费MCP课程,助你构建上下文感知的智能应用
Hugging Face 推出免费MCP课程,介绍Anthropic推出的Model Context Protocol协议,帮助开发者实现更智能的AI应用。
字节跳动Seed1.5-VL复杂图表精准抽取,Deep Think是多模态未来的主流
Seed1.5-VL 是一个由 ByteDance 开发的多模态语言模型,在处理复杂表格、模糊图片和几何题目等方面表现出色。其架构包含视觉编码器和MoE LLM。预训练数据包括3万亿高质量token,遵循幂律和对数线性关系。Seed1.5-VL 在Hugging Face上可用体验,并通过强化学习后处理提升性能。
微软Sonora:人机共创的 3D 音频世界! 用 AI 重新思考声景及其对焦虑和认知负荷的影响
Sonora是由微软研究院开发的人工智能系统,提供实时语音驱动的沉浸式3D音频环境创建与导航,旨在通过个性化和互动性促进放松并减轻焦虑。
大厂大模型必知的5种agent模式
反射、工具使用、ReAct、规划及多智能体模式分别介绍了不同类型的交互与决策流程。通过用户输入查询、大型语言模型生成初始输出、用户反馈调整响应等机制,提高AI系统的准确性和灵活性。
扩大 LLM 能实现 AGI吗?
计算机科学家Stuart Russell认为大型语言模型(LLM)不会导致通用人工智能(AGI),多数AI研究人员也持相似观点。Russell预测未来AI公司会探索替代方法,政府可能不会采取行动。他认为最坏的情况是「切尔诺贝利规模的灾难」,需要人类醒来并采取措施。