香港中文大学(深圳)开源的一款语音理解模型:Soundwave
香港中文大学(深圳)开源的Soundwave语音理解模型仅需1万小时训练数据,即达到Qwen2-Audio同等性能,具备智能对话和复杂语音交互能力。
香港中文大学(深圳)开源的Soundwave语音理解模型仅需1万小时训练数据,即达到Qwen2-Audio同等性能,具备智能对话和复杂语音交互能力。
Qwen2.5-QwQ-37B-Eureka-Triple-Cubed 是一个增强版的AI模型,专注于推理和思考能力。它采用了’Triple Cubed’方法,支持128K上下文,并适用于多种任务如科学研究、创意写作等,具有高温度推理支持和性能优化等特点。
一款名为SmolDocling的轻量级OCR模型,仅256M参数,支持文档中的标题、正文、图表等多任务识别,并能导出为Markdown、HTML等多种格式。
有人宣称创办一家通过包装现有基础模型实现全新体验的”套壳公司”。这一声明引发了科技圈热烈讨论,认为看似简单的行为实际上体现了无数成功的科技公司在竞争中获胜的关键因素:优秀的用户体验。
波士顿动力Atlas人形机器人通过与AI机构RAI Institute的合作,利用动作捕捉服和强化学习技术,模仿真人动作。这项研究展示了大量模拟数据对机器人的训练效果,并强调了实际应用之间的差距需要深入探讨。
腾讯在AI大模型领域坚持开源策略,并逐步推出多种模态的大模型。汤道生表示,除了自研混元系列大模型外,还积极拥抱开源模型,提供多样选择满足用户需求。同时强调了产品化的重要性,包括构建高质量的知识库和算力支持。
腾讯2024年财报显示,总收入6603亿元,同比增长8%,其中游戏业务营收增长9.9%。马化腾称受益于AI赋能的广告平台升级等策略取得双位数收入增长,并持续提升运营效率。刘炽平透露旗下AI助手腾讯元宝日活激增超20倍。腾讯在研发方面投入创历史新高,加速推进自研和开源大模型落地。
Sia晒完新技能后,谷歌 Gemini 网页 Canvas 功能上新。用户只需点击要求,AI 即可协助写作、生成代码和设计网页等内容。Gemini 还推出了 Audio Overview 功能,帮助用户总结分析深度报告内容。