跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

GitHubStore

全球首个端侧全模态理解模型:Megrez-3B-Omni,能同时处理图片、音频、文本

2024年12月22日12时 作者 GitHubStore

Megrez-3B-Omni是无问芯穹研发的端侧全模态理解模型,基于Megrez-3B-Instruct扩展,在图像、语音和文本领域均取得最优精度。

分类 开源 标签 Megrez-3B-Omni、 图片、 文本、 无问芯穹、 端侧全模态理解模型、 音频 发表评论

Meta开源的AI试衣模型Leffa

2024年12月21日12时 作者 GitHubStore

项目Leffa是用于可控人物图像生成的统一框架,能精确控制人物外观和姿势,通过注意力学习流场减少细粒度纹理细节失真。

分类 开源 标签 Francis、 Huawei Technologies Co., Ltd.、 可控人物图像生成、 正则化损失机制、 注意力学习流场、 高图像质量 发表评论

史上最强的第三方bilibili客户端:pilipala

2024年12月19日10时 作者 GitHubStore

使用Flutter开发的Bilibili第三方客户端,支持Android和iOS平台。目前主要集中在移动端功能开发中,包括推荐视频列表、热门直播、番剧列表等,并提供用户主页查看、动态评论等功能。

分类 开源 标签 Flutter、 GitHub、 用户功能、 移动端、 第三方客户端、 阿里巴巴云 发表评论

开源视频创建及编辑框架Revideo

2024年12月18日16时 作者 GitHubStore

Revideo 是一个开源框架,允许开发者在 Typescript 中创建视频模板并将其作为 API 端点部署。它还提供了一个 React 播放器组件用于实时预览浏览器中的变化。通过分析用户行为,Revideo 使用 Posthog 了解其使用情况。

分类 开源 标签 ffmpeg、 Google Cloud Run、 Motion Canvas、 Revideo、 开源框架、 无头渲染 发表评论

自动给视频配音效MMAudio

2024年12月17日8时 作者 GitHubStore

MMAudio 是一个用于生成同步音频的项目,利用多模式联合训练从给定视频和/或文本输入中生成音频。它允许对广泛的数据集进行训练,并将生成的音频与视频帧对齐。

分类 开源 标签 CLIP、 demo.py、 miniforge、 MMAudio、 PyTorch、 Synchformer 发表评论

一键将视频转换为优质小红书笔记!

2024年12月16日10时 作者 GitHubStore

一键将视频转换为优质小红书笔记,适用于内容创作者、知识管理者和社交媒体运营。特点包括标题创作、内容优化及标签系统等,支持Python脚本处理单个或批量视频链接生成笔记。

分类 开源 标签 OpenRouter API、 Unsplash API、 二极管标题法、 小红书、 视频笔记生成器、 阿里巴巴 发表评论

开源英语语法检查工具Harper

2024年12月13日14时 作者 GitHubStore

一款专为开发者设计的开源英语语法检查工具,提供多种安装方式和Obsidian插件,旨在替代Grammarly,具备高效、轻量和私密特点。

分类 开源 标签 GitHub、 Harper、 开源项目、 美式英语、 英语语法检查工具、 轻量级插件 发表评论

快速将一个 Github 仓库转为 LLM 友好理解的文本 – gitingest

2024年12月13日14时 作者 GitHubStore

一键将任何 GitHub 存储库转化为 LLM 提示友好文本摄取,并提供文件统计、格式化输出等特性。

分类 开源 标签 apianalytics.dev、 FastAPI、 GitHub、 gitingest.com、 LLM、 Tailwind CSS 发表评论

远程语音卫星Wyoming Satellite

2024年12月12日12时 作者 GitHubStore

远程语音卫星使用Wyoming协议进行本地唤醒词检测和音频增强,与智能家居系统无缝对接。通过Python脚本配置麦克风并运行卫星服务,支持多种唤醒词,并提供技术交流群和合作机会。

分类 开源 标签 127.0.0.1:10400、 alsutils、 openwakeword服务、 Python3.7+、 remote唤醒词检测、 Wyoming协议 发表评论

将 Docker 镜像编译成独立运行的二进制文件dockerc

2024年12月12日12时 作者 GitHubStore

无需 Docker run、pip install 或 npm i,Dockerc 可生成可执行文件供用户直接运行。支持多种操作系统和架构,并通过 Skopeo 加载镜像。

分类 开源 标签 arm64支持、 GitHubStore、 Nils Irl、 容器化工具、 无需安装命令 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面22 页面23 页面24 页面25 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×