开源
1小时+1.3元成本!让MiniMind-V教你零代码训练自己的多模态AI模型!
一款名为MiniMind-V的开源模型简化了多模态视觉语言模型(VLM)的训练流程,仅需1小时和不到1.3元的成本即可完成训练。该模型参数量为26M,适合个人开发者从零开始学习,并提供了详细的数据处理、预训练和指令微调代码。
本周爆火开源,基于AI大模型的视频翻译和配音工具,精准切分、对齐字幕。
KrillinAI 是一款基于 AI 大模型的专业视频翻译配音工具,支持一键全流程部署,具备精准字幕识别、智能分段、专业翻译等功能。
阿里巴巴发布FantasyTalking,它可以对角色进行口型同步,并具有逼真的面部和全身动作
阿里巴巴发布FantasyTalking,能够实现角色口型同步,并具备逼真的面部和全身动作,表现优于现有SOTA方法。
字节跳动刚发布 Seed-Thinking-v1.5 的技术细节报告
字节跳动发布Seed-Thinking-v1.5技术细节报告,其性能接近Gemini-2.5-Pro和O3-mini-high水平。
让AI访问微信聊天记录的MCP:chatlog
支持Windows/macOS系统的AI助手MCP:chatlog可从本地微信聊天记录数据库文件中提取数据,提供命令行界面及终端菜单操作,并可通过API访问聊天记录、联系人、群聊和最近会话等信息。
MCP新应用!这个开源神器让网站秒变AI知识库!零代码实现全站内容对话!
SiteMCP是一款GitHub上的开源工具,一键抓取网站内容并转化为MCP服务器,简化了AI处理网站信息的繁琐步骤,特别适合需要快速获取网站知识的用户。