全球首个端侧全模态理解模型:Megrez-3B-Omni,能同时处理图片、音频、文本
Megrez-3B-Omni是无问芯穹研发的端侧全模态理解模型,基于Megrez-3B-Instruct扩展,在图像、语音和文本领域均取得最优精度。
Megrez-3B-Omni是无问芯穹研发的端侧全模态理解模型,基于Megrez-3B-Instruct扩展,在图像、语音和文本领域均取得最优精度。
使用Flutter开发的Bilibili第三方客户端,支持Android和iOS平台。目前主要集中在移动端功能开发中,包括推荐视频列表、热门直播、番剧列表等,并提供用户主页查看、动态评论等功能。
Revideo 是一个开源框架,允许开发者在 Typescript 中创建视频模板并将其作为 API 端点部署。它还提供了一个 React 播放器组件用于实时预览浏览器中的变化。通过分析用户行为,Revideo 使用 Posthog 了解其使用情况。
一键将视频转换为优质小红书笔记,适用于内容创作者、知识管理者和社交媒体运营。特点包括标题创作、内容优化及标签系统等,支持Python脚本处理单个或批量视频链接生成笔记。
远程语音卫星使用Wyoming协议进行本地唤醒词检测和音频增强,与智能家居系统无缝对接。通过Python脚本配置麦克风并运行卫星服务,支持多种唤醒词,并提供技术交流群和合作机会。
无需 Docker run、pip install 或 npm i,Dockerc 可生成可执行文件供用户直接运行。支持多种操作系统和架构,并通过 Skopeo 加载镜像。