小兵的AI视界，作者每时AI

Ring-lite：2.75B参数碾压大模型？蚂蚁开源推理神器如何做到小身材大智慧

2025年7月10日14时作者小兵的AI视界

ite
，
作为一款基于
MoE
架构的轻量级推理模型，凭借其创新的
C3PO
强化学习训练方法和高

2025年7月9日14时作者小兵的AI视界

光、
CT
、
MRI
、超声、病理等
，并在医疗多模态
/
文本问答和报告生成任务上达到
SOT

2025年7月8日14时作者小兵的AI视界

随着人工智能发展，多模态成为热点。MiniMax MCP Server是一款开源的多模态生成服务器，支持视频、图像、语音等多种生成能力，兼容多种主流MCP客户端。

2025年7月7日14时作者小兵的AI视界

阿里达摩院与浙江肿瘤医院联合推出DAMO GRAPE项目，基于非增强CT影像识别早期胃癌。该模型在大规模临床研究中表现出85.1%的敏感性和96.8%的特异性，显著优于人类放射科医生。

2025年7月5日14时作者小兵的AI视界

浙江大学联合阿里巴巴集团推出的OmniAvatar模型在音频驱动全身视频生成领域实现了突破性进展，支持自然、逼真的表情和动作同步，并广泛应用于虚拟形象制作、互动社交平台、教育培训等多个领域。

2025年7月4日14时作者小兵的AI视界

Osmosis-Structure-0.6B 是一款小型语言模型，专注于结构化输出生成。通过强化学习和大量结构化数据训练，在数学推理任务中表现出色，并在多个领域如智能客服、数据分析和教育辅导中有广泛应用。

2025年7月2日14时作者小兵的AI视界

于能够快速、高效生成可视化图表的工具的需求日益增长。蚂蚁
AntV
团队推出的
MCP Server

2025年7月1日14时作者小兵的AI视界

理复杂文档时往往存在局限性。
Nanonets-OCR-s
作为一款先进的图像到
Markdown

2025年6月30日14时作者小兵的AI视界

腾讯AI Lab开源项目SongGeneration通过先进的技术架构和算法实现了高质量音乐生成。它支持文本控制、多轨合成和风格跟随等功能，并在多个应用场景中取得了优异表现。