月度归档: 2025 年 3 月
华为董事:大模型Token流量激增33倍!
预计到2030年,中国市场Token带来的日均网络流量将达到500TB左右,相比当前的90TB增长了近6倍。华为认为AI将重塑内容生产和传播方式,并推动移动通信网络向多模态交互转型。
用Agent生成Manim动画视频用来解释定理辅助教学,低资源消耗的离线翻译服务器,开源AI 写作助手
TheoremExplainAgent生成可视化的定理讲解视频;AI写作助手定制化生成高质量内容;MTranServer超低资源离线翻译服务器;ReSearch通过强化学习提升问答效果无需监督数据;CoE通过层内专家间迭代通信提高LLM性能和效率。
将几乎所有内容轻松转换为Markdown格式的神器Markdownify MCP
Markdownify 是一个模型上下文协议服务器,用于将多种文件类型和网页内容转换为 Markdown 格式。它支持 PDF、图片、音频、DOCX、XLSX 和 PPTX 文件的转换,并能处理视频字幕、必应搜索结果等。
独家丨爱诗科技完成A5轮融资,PixVerse月活突破1500万并将在国内上线
爱诗科技完成A5轮融资,由靖亚资本独家投资,公司致力于AI视频生成技术,并已在海外推出PixVerse移动App。其最新版本在生成速度和精准度方面表现出色,用户量已突破4000万,未来目标是实现“实时生成”并成为全民级的AI视频创作平台。
重新认识荣耀:一家AI终端生态公司
荣耀宣布转型为全球领先的AI终端生态公司,并展示了其在智能手机、平板电脑、智能手表和耳机等多款产品中的AI特性。通过AI技术重新定义人机交互,荣耀致力于打造无缝连接的生态体系,激发人类潜能,推动科技前沿的发展。
Phi 4 Multimodal:微软开源的多模态大模型,支持音频、视觉和文本处理
微软开源的多模态大模型Phi 4 Multimodal,在OpenASR排行榜上排名第一,性能卓越;支持音频、视觉和文本处理。亮点包括使用LoRAs混合技术添加模态适配器等。参数量达38亿的Phi-4-Mini版本已发布。