对话即界面!微软NLWeb开源:任何网站都能‘一键变身’智能AI助手

微软推出NLWeb开源项目,结合自然语言处理和大型语言模型技术,让网站能够像AI助手一样与用户进行流畅对话。应用场景包括零售购物、餐饮服务等,开发者可根据需求快速部署使用。

录制用户操作简化RPA流程,实现浏览器自动化Workflow Use,DeepMind 的 AlphaEvolve 开源实现,

本文介绍了五款开源工具:Workflow Use简化RPA流程、OpenAlpha_Evolve利用进化算法发现自主算法、OpenManus无需邀请码即实现AI代理、BrowserBee结合LLM控制隐私优先的网页自动化任务,以及nanoDeepResearch从零构建ReAct智能体工作流。

字节跳动Seed1.5-VL复杂图表精准抽取,Deep Think是多模态未来的主流

Seed1.5-VL 是一个由 ByteDance 开发的多模态语言模型,在处理复杂表格、模糊图片和几何题目等方面表现出色。其架构包含视觉编码器和MoE LLM。预训练数据包括3万亿高质量token,遵循幂律和对数线性关系。Seed1.5-VL 在Hugging Face上可用体验,并通过强化学习后处理提升性能。