3 月 2025 - 第126页共274页

目标检测技术的发展：从R-CNN、YOLO到DETR、DINO

2025年3月18日14时作者机器学习算法与自然语言处理

近些年基于深度学习的目标检测技术迅速发展，从两阶段到一阶段，再到金字塔网络。本训练营将涵盖视觉核心项目：分割和检测的全面细致讲解，并由专家进行实战指导。

实测文心X1：便宜大碗还能自主调用工具，引发硅谷反思？

2025年3月18日11时作者硅星人Pro

百度发布了文心大模型4.5和文心X1，展示了高性能与低成本相结合的发展路径。文心X1在推理成本、技术优化等方面实现了突破，具备全链路极致调优能力，包括模型压缩、推理引擎优化等；文心大模型4.5表现出卓越的多模态理解能力和极低幻觉率。百度通过这些技术创新，不仅提升了AI性能，还使其更适合作为行业应用的基础。

傅利叶开源全尺寸人形机器人数据集Fourier ActionNet

2025年3月18日11时作者机器人开放社区

傅利叶17日发布全球首个全尺寸人形机器人数据集Fourier ActionNet和全流程工具链，提供高质量真机训练数据及一套从采集到部署的解决方案，助力开发者降低研发门槛。

SmolDocling-256M多模态OCR识别，用于治疗推理的智能体TxAgent，

2025年3月18日11时作者每日AI新工具

SmolDocling-256M-preview高效文档转换模型，支持多种元素识别和转换。OpenSearch-SQL无需额外训练提升文本到SQL生成准确性。MarkPDFDown精准将PDF转为Markdown格式。TxAgent利用多步骤推理提供个性化治疗方案。RDAgent自动化数据驱动研发流程，加速创新研究。

8张GPU训出近SOTA模型，超低成本图像生成预训练方案开源

2025年3月18日11时作者量子位

港科大Harry Yang团队联合Everlyn AI提出LightGen模型，仅需8张GPU训练即可实现近SOTA的高质量图像生成效果。该模型采用数据蒸馏和直接偏好优化策略，显著降低了数据规模与计算资源需求。

陶哲轩：o3-mini纠正了我一个数学错误，十分钟解决原本一小时才能完成的题目

2025年3月18日11时作者量子位

大模型o3-mini和GPT-o1在数学方面表现出色，陶哲轩和罗博深分别对其进行了测试，并且给予了高度评价。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31