开源星探，作者每时AI

AI语音克隆神器！Seed-VC：零样本实时转换语音和歌声，实时语音延迟最低300毫秒！

2025年3月19日16时作者开源星探

Seed-VC 是一款强大的开源语音转换和歌声转换工具，支持零样本语音克隆、实时语音转换及AI歌曲转换。它基于字节跳动 SEED-TTS 架构开发，延迟低至400毫秒，适用于配音、虚拟主播等场景。

2025年3月18日8时作者开源星探

ReasonGraph 是一款开源工具，将大语言模型的推理过程可视化为直观图表，支持多种推理方式，并实时更新和交互分析。它能帮助用户理解AI思考路径，适用于LLM研究、调试评估等场景。

2025年3月17日8时作者开源星探

阿里通义实验室薄列峰团队首次将RLVR应用于全模态LLM，聚焦情感识别任务。R1-Omni模型提升了推理、理解与泛化能力，在多模态数据集上表现出色，并已开源。

2025年3月17日8时作者开源星探

一款结合大语言模型和网络搜索功能的AI研究助手Local Deep Research，支持终端和网页界面使用，具备自动化深度研究、智能信息筛选及PDF导出等功能，强调隐私与效率并重。

2025年3月15日16时作者开源星探

阿里的新夸克上线了，新增深度思考模式和学术搜索等新功能，通过意图识别实现快速准确的效果，展示了阿里在模型和应用层的优势。

2025年3月15日16时作者开源星探

一款名为CSM的新开源TTS模型由Sesame最新发布，能够生成带有上下文情感、自然语气和音调变化的人工智能语音。它具有高保真效果、端到端Transformer生成能力、上下文理解以及实时语音生成等功能。

2025年3月14日8时作者开源星探

通过MCP-Playwright协议，大语言模型如Claude能够直接控制浏览器进行网页交互、数据抓取等任务。它支持点击按钮、填写表单、执行JavaScript代码等功能，并提供截屏和分析页面的能力。

2025年3月14日8时作者开源星探

Google开源Gemini 2.0多模态生图功能，用户只需一句话即可对图片进行修改或创作，如换发色、闭眼、改变对象身份等，展示了生成式AI在图像编辑领域的巨大进步。

2025年3月14日8时作者开源星探

2025上半年软考备考开始啦，免费VIP通关规划课助你高效备考。3个月冲刺班提供考情解析、答题技巧等资源，助力零基础考生快速通过考试。

2025年3月13日8时作者开源星探

一款标星22.6K的开源云盘系统Cloudreve支持多存储服务、离线下载、WebDAV访问等功能。它采用Go语言开发，提供React前端框架，并且有多种安装方式供用户选择。