谷歌
谷歌首个混合推理模型Gemini 2.5 Flash:性能与o4-mini相媲美、可灵活控制「思考预算」
谷歌发布首个混合推理模型Gemini 2.5 Flash,支持灵活控制思考预算。相比Claude,新模型在知识问答和代码任务上性能更优,并且具有更高的性价比。
谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini
谷歌发布首个混合推理模型Gemini 2.5 Flash,引入了革命性”思考预算”功能,性能显著提升,在多个基准测试中表现优异。
谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命
谷歌发布DolphinGemma大模型,基于30年海豚研究数据训练,能识别并预测海豚声音模式,参数仅400M,可在普通手机上运行。这是人类首次能够与动物进行实时交流的AI模型。
速递|8秒视频只是起点,谷歌Veo 2携8秒720P视频登陆Gemini,硬刚OpenAI Sora
谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按钮上传至TikTok、YouTube等平台。
谷歌最先进的视频生成模型Veo 2,使用自然语言查询终端命令,将多种Agent框架转换为MCP服务器工具
谷歌最先进的视频生成模型Veo 2能将文本、图像或两者结合转化为八秒的视频,它擅长理解简单和复杂指令,并准确模拟现实世界的物理规律。开发者可以通过Google AI Studio、Gemini API等平台使用Veo 2的核心功能包括文本到视频和图像到视频。同时介绍Python工具Zev用于自然语言查询终端命令、VS Code扩展RooFlow增强AI辅助开发、实时会议转录APIVexa支持多种平台并提供企业级安全保障的工具automcp。
重磅!谷歌新AI成功预测海豚语言!跨物种沟通新时代,要来了!
谷歌推出海豚语言模型DolphinGemma,专门研究海豚交流。该模型基于400M参数进行训练,并能在Pixel手机上直接运行。研究人员收集了1985年以来的大西洋斑海豚数据,分析出固定组合的哨声。此模型有望实现跨物种交流,但需谨慎处理可能影响动物心理健康的问题。
海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗
谷歌推出DolphinGemma模型,基于WDP合作的野生大西洋斑点海豚声学数据库训练而成,能够学习和生成类似海豚声音序列,助力跨物种交流。
Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战
谷歌Gemini 2.5 Pro在多语言编程基准测试中表现优异,性价比最优,引发广泛关注。近期又曝光了更强的模型Dragontail,在Web开发领域表现出色,有望进一步提升谷歌在AI领域的领先地位。
对标OpenAI,谷歌开源Agent SDK,支持MCP、A2A、5000星
谷歌在Google Cloud Next大会上发布了首个智能体开发套件—ADK。此套件能简化开发复杂流程的智能体,支持双向音频、视频及最新的A2A协议,并兼容超过200个第三方模型。ADK简单介绍仅需6行代码即可实现问答智能体开发。Agent Engine则负责部署和管理智能体,提供短期记忆功能,确保智能体会话连续性,还提供了Vertex AI评估工具以优化智能体性能。