月度归档: 2025 年 3 月
目标检测技术的发展:从R-CNN、YOLO到DETR、DINO
近些年基于深度学习的目标检测技术迅速发展,从两阶段到一阶段,再到金字塔网络。本训练营将涵盖视觉核心项目:分割和检测的全面细致讲解,并由专家进行实战指导。
又一本开源免费的大模型书来了,449页pdf!
《自然语言处理:大模型理论实践》一书全面覆盖从基础到高级的自然语言处理内容,介绍大模型在技术与应用中的进展。文章还提及了华为全联接大会和沃恩智慧的大模型免费试用活动。
Cursor 被爆致命隐患,YOLO 模式正成黑客新宠!
Cursor AI 因其方便快捷的 YOLO 模式成为安全研究人员的新目标。Ilias Ism 披露了黑客可能利用此功能完全控制电脑的风险,引起广泛关注。专家建议使用命令拒绝列表、在容器中运行以及避免环境变量权限等措施来保障安全性。
实测文心X1:便宜大碗还能自主调用工具,引发硅谷反思?
百度发布了文心大模型4.5和文心X1,展示了高性能与低成本相结合的发展路径。文心X1在推理成本、技术优化等方面实现了突破,具备全链路极致调优能力,包括模型压缩、推理引擎优化等;文心大模型4.5表现出卓越的多模态理解能力和极低幻觉率。百度通过这些技术创新,不仅提升了AI性能,还使其更适合作为行业应用的基础。
傅利叶开源全尺寸人形机器人数据集Fourier ActionNet
傅利叶17日发布全球首个全尺寸人形机器人数据集Fourier ActionNet和全流程工具链,提供高质量真机训练数据及一套从采集到部署的解决方案,助力开发者降低研发门槛。
SmolDocling-256M多模态OCR识别,用于治疗推理的智能体TxAgent,
SmolDocling-256M-preview高效文档转换模型,支持多种元素识别和转换。OpenSearch-SQL无需额外训练提升文本到SQL生成准确性。MarkPDFDown精准将PDF转为Markdown格式。TxAgent利用多步骤推理提供个性化治疗方案。RDAgent自动化数据驱动研发流程,加速创新研究。
8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源
港科大Harry Yang团队联合Everlyn AI提出LightGen模型,仅需8张GPU训练即可实现近SOTA的高质量图像生成效果。该模型采用数据蒸馏和直接偏好优化策略,显著降低了数据规模与计算资源需求。