开源
专为自动化任务设计的开源无头浏览器
Lightpanda 是一款为无头环境设计的开源浏览器,支持 JavaScript 执行、部分 Web API,并兼容 CDP。它以极低内存占用和快速启动特性著称,通过 AI 代理实现网络自动化测试。
推荐一款免费的高质量TTS API项目,替代付费服务,零成本生成高质量语音!
OpenAI-Edge-TTS 是一个开源的免费文本转语音API接口,利用微软 Edge 的在线语音服务提供高质量的功能和语音质量。支持多种语言、播放速度调整及多种音频格式。
3.4k星星!开源超低延迟实时语音转文本STT,支持语音活动检测、唤醒词激活。
RealtimeSTT是基于Whisper的流式语音转文字项目,具有实时性和纠错机制。它能快速监听麦克风并转换为文本,适用于需要快速精准转换的应用场景。
社区供稿 | MiniMax-01 开源: 新架构开启 Agent 时代
近日,MiniMax 发布了全新系列模型MiniMax-01,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型参数量高达4560亿,可以高效处理全球最长的400万token上下文,并实现了线性注意力机制,性能接近GPT-4。
3.4k星星!开源超低延迟实时语音转文本SST,支持语音活动检测、唤醒词激活。
今天介绍的是RealtimeSTT项目,它是基于Whisper的基础上做的SST功能。其主要特点是流式输出、实时纠错机制和语音活动检测等功能,适用于需要快速精准转换的应用场景。
实用指南:Awesome LLM Apps,轻松搞定各类任务
文章介绍了一个名为 awesome-llm-apps 的开源项目,展示了多个基于大型语言模型的应用实例。该项目涵盖RAG技术、智能代理应用以及在金融、内容创作、个人管理、旅行规划和教育科研领域的具体应用场景,强调了这些应用如何帮助用户解决问题并提升工作效率。
AI Agent完整工具包,OmAgent多模态Agent,本地化的实时语音对话聊天机器人
本期内容涵盖了AI代理服务工具包、多模态语言代理库OmAgent、实时语音聊天机器人Weebo、智能跟踪Chrome扩展AutoMouser以及LLM课程。