Sonos推出AI语音增强应用帮助听力障碍人士
Sonos推出语音增强解决方案,通过AI提升听力受损人群观看电视时的对话清晰度。该功能允许用户根据需求调整对话清晰度级别,最高级别专门设计用于听力受损者。
Sonos推出语音增强解决方案,通过AI提升听力受损人群观看电视时的对话清晰度。该功能允许用户根据需求调整对话清晰度级别,最高级别专门设计用于听力受损者。
谷歌在2025年I/O大会上发布多款新产品和功能,其中最引人注目的是Veo3视频模型及其配套的Flow平台。Flow主打“视频编辑与剪辑”,支持原生音频同步生成有声视频,并能一键直出人物对白、音效及环境声音的效果自然逼真。Veo3冲击了AI视频制作工作流,对垂类数字人产品和AI剪辑应用构成了威胁。
Anthropic 新版 Claude 模型 Claude 4 已进入内测阶段,包括新模型 Sonnet 4 和 Opus 4。Claude 4 安全级别为 ASL-3,能力更强但潜在滥用风险更高。Claude 4 具备推理与工具调用的能力。
微软研究院与北大提出的大规模混合推理模型LHRMs能够在用户查询时自适应地决定是否进行思考,实现更快、更自然的日常交互,并在推理和通用能力方面超越现有模型的同时显著提高了效率。
MLNLP社区是国内外知名的机器学习与自然语言处理社区。最新研究发现,大型语言模型(LLM)在AI团队中可能盲目跟随多数意见,甚至放弃原本正确的判断。浙江大学团队的研究指出多AI协作系统存在类似人类‘群体思维’的现象,并开发了测试平台验证这一现象。
近期,阿里云发布了BGE系列的新版本,包括适用于代码检索的BGE-Code-v1、多模态问答及推荐的BGE-VL-v1.5和可视化信息检索的BGE-VL-Screenshot。这些模型在各自领域表现出色,并已在相关基准测试中刷新了记录。
MLNLP社区是国内外知名的人工智能学术社区,专注于推动机器学习与自然语言处理领域的交流与发展。马蒂亚斯·多普克因特朗普政府对美国高等教育的收紧政策而辞去了美国的工作,认为不确定性已影响到他的学生和研究环境。
近年来AI大模型技术快速发展,涵盖翻译、聊天机器人等多种应用场景。多模态和长程推理能力增强,推动了其在医疗、教育等领域的应用,年薪可达90万的岗位需求增加。OpenAI的大模型如GPT系列及Meta的LLama系列提升了用户体验与功能多样性。
智元机器人发布了具有突破性的具身世界模型EVAC和具身世界模型评测基准EWMBench,以解决模型评测成本高和数据价值未能充分挖掘利用的问题。这标志着具身智能进入了“算法-评测”协同进化时代。