复旦&微软提出StableAnimator: 首个端到端的高质量ID一致性人类视频生成新框架!

复旦大学与微软等机构提出StableAnimator框架,实现高质量身份一致性人类视频生成。该框架通过全局内容感知面部编码器、分布感知的身份适配器和基于HJB方程的面部优化来保持人物身份信息的一致性并提升视频质量。

12K Star 适配多场景!MarkItDown:微软开源多格式文档处理工具,轻松将文件转为 Markdown 格式!

一款多功能文档处理工具MarkItDown由微软开源提供,支持PDF、Office文档、图片、音频等多种格式文件转换为Markdown格式,具备OCR文字识别、语音转文字等功能。适用于文档批量处理、索引检索和数据分析等场景。

微软 Phi-4 震撼发布:14B 参数模型性能超越 一众大模型,数学推理性能提升显著

微软发布的Phi-4大语言模型在数学推理方面表现出色,准确率达到91.8%。该模型通过高质量合成数据集、精心策划的数据以及先进的后训练技术实现了这一成就,并已在Azure AI Foundry平台发布。