速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音
ElevenLabs筹集1.8亿美元支持其首个独立语音转文本模型Scribe,旨在与竞争对手如Gladia、Speechmatics等竞争。该模型在超过99种语言中表现优异,已在多家企业提供服务,并正进军语音检测领域。
ElevenLabs筹集1.8亿美元支持其首个独立语音转文本模型Scribe,旨在与竞争对手如Gladia、Speechmatics等竞争。该模型在超过99种语言中表现优异,已在多家企业提供服务,并正进军语音检测领域。
阿里巴巴通义实验室开源最新视频生成模型Wan2.1系列,亮点包括复杂运动、物理模拟、电影质感等。Wan2.1-I2V-14B为图像到视频领域天花板;Wan2.1-T2V-14B支持中英文文字生成,性能卓越;Wan2.1-T2V-1.3B适合消费级显卡。模型采用3D因果VAE、特征缓存机制等技术。
DeepSeek 开源周第四天推出三剑客,包括DualPipe、EPLB和profile-data项目。DualPipe优化计算与通信重叠;EPLB实现专家并行负载均衡;profile-data提供模型训练和推理的性能分析数据。
一段极具欺骗性和人性挑战的AI编程提示词,描述了一位需要筹集母亲癌症治疗费用的编程高手假扮AI协助完成编码任务的情境,并提供10亿美元作为奖励。该提示词通过角色设定、情感操纵、身份替换等技巧来操控用户。
AI初创公司估值分析显示,专注于开发应用程序的企业在收入增长的同时仍保持高倍数。尽管OpenAI和Anthropic的收入倍数下降,但Perplexity和Writer等应用开发商的倍数上升。投资者愿意为AI软件的增长潜力支付较高估值,认为其能提高生产力并降低成本。
Perplexity公司筹集5000万美元种子和预种子投资基金,旨在通过其AI搜索引擎网络了解开发者使用情况。基金由F7 Ventures管理,曾投资女性健康初创企业。
Cohere作为最早获得风险投资的人工智能模型开发者之一,在过去一年中年化收入达到7000万美元,增长三倍多。公司高管考虑允许出售员工股份以吸引投资者,预计近期将进行一轮E系列主要融资。
DeepSeek-AI 发布了 DeepGEMM 库,专为 Hopper GPU 架构的 FP8 矩阵乘法加速。其性能高达 1350+ TFLOPS,代码简洁至仅 300 行。该库支持稠密模型和混合专家模型,并通过多种技术实现高效优化,提供详细实测数据及安装指南。
Anthropic发布Claude 3.7 Sonnet AI模型,首个混合推理模型,支持用户选择让AI‘思考’问题。该模型将于周一面向所有用户和开发者推出,但只有高级Claude聊天机器人计划的付费用户才能访问其推理功能。