谷歌DeepMind推出最强AI手语翻译模型SignGemma了
无声者的AI翻译工具SignGemma改变了手语识别和翻译技术,使聋人群体能够直接通过手势操控设备,推动了原生手语交互界面、聋人文化数字新大陆以及多元人机交互革命的发展。
无声者的AI翻译工具SignGemma改变了手语识别和翻译技术,使聋人群体能够直接通过手势操控设备,推动了原生手语交互界面、聋人文化数字新大陆以及多元人机交互革命的发展。
DeepMind发布形式化数学猜想库,收录多种形式化的数学猜想。该资源库旨在帮助AI提升数学推理及证明能力,并有望成为自动定理证明或形式化工具的测试基准。
在Google I/O 2025开发者大会上,谷歌发布了先进的AI视频生成模型Veo 3,它能够同时生成带有声音的视频。该模型目前仅限美国Gemini Ultra订阅者和Vertex AI的企业用户使用。
谷歌推出Gemini Diffusion,通过扩散技术将语言模型文本生成速度提升至2000token/秒,甚至超越了较大的模型Gemini 2.0 Flash-Lite。这种技术能够快速迭代并纠正错误,提高生成连贯性和一致性。
AI决策能力不足成为行业关注的问题。谷歌DeepMind与LIT AI实验室的研究通过强化学习微调技术提升了语言模型500%的决策能力。该方法利用思维链作为训练信号,并设计了惩罚-塑造机制,使模型能够在动态环境中做出可持续决策。研究显示单一增加模型规模无法突破执行鸿沟。
谷歌DeepMind的AlphaEvolve系统展示了超越人类专家的算法设计能力。它成功优化经典算法,并提出新的解决方案。AlphaEvolve利用进化算法结合Gemini模型生成代码,发现全新的、正确的算法,引发了业界关注。
谷歌DeepMind发布了AlphaEvolve模型,这是一个基于Gemini的独特编码代理,可用于设计高级算法、改进AI芯片设计以及解决数学和计算机科学领域中的其他重大问题。该模型展示了自主进化的潜力,并在内部应用中取得了显著效果,同时有望推进更广泛的科研和技术领域的进步。
谷歌发布AlphaEvolve AI工具,用于设计高级算法并解决数学难题,提升效率23%;OpenAI推出GPT-4.1提升编程能力;阿里云和腾讯云也在推动AI程序员应用。