字节跳动
Video Depth Anything来了!字节开源首款10分钟级长视频深度估计模型,性能SOTA
Video Depth Anything 工作解决了单目深度估计在视频领域的时序一致性问题,融合时空头、时域一致性损失函数和关键帧推理策略,实现精度、速度及稳定性三者的平衡。
ComputerUse再来重磅玩家,字节跳动开源 纯视觉驱动GUI 智能体模型 UI-TARS,桌面浏览器全支持
字节跳动开源UI-TARS模型,通过纯视觉驱动和端到端架构实现高效GUI自动化操作,支持多种平台,已在GitHub上发布多个版本供开发者试用。
字节的可以直接操作图形界面的原生 GUI 智能体模型UI-TARS
UI-TARS 是一种智能体模型,可以直接理解并操作图形界面的原生 GUI 智能体,它具有感知、行动、推理和记忆等关键能力。相比传统拼装方法,UI-TARS 使用一个“大模型”进行端到端学习,提升了灵活性与稳健性,并在某些测试上超过了 Claude 和 GPT-4。
一人能顶一个公司:字节AI编程神器Trae诞生了!
2024年推出的中文友好的AI编程IDE Trae发布,支持实时建议、代码片段生成等功能,内置Claude-3.5-Sonnet免费聊天模型,简化了项目开发和日常编码过程,特别适合英语非母语开发者。
不止免费无限次Claude 3.5:字节 Trae 能否颠覆 Cursor、WindSurf?小项目亲测体验
AI 编程工具 Trae 由字节跳动推出,界面友好且功能强大。与竞品相比,它支持全中文设计、预览功能和强大的上下文理解能力。其免费无限次使用 GPT-4 和 Claude-3.5 的优势吸引了众多开发者。
豆包发布大模型 1.5 Pro ,实测后我发现这个国产 AI 用最「笨」的方法干翻了 GPT-4o
字节跳动旗下大模型1.5系列发布,包括Doubao-1.5-pro、Doubao-1.5-lite等产品线,并在公开评测基准中表现出色,展示了中国AI技术的进步。