AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相
日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。
同一天,Google先扔出了Genie 3
日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。
同一天,Google先扔出了Genie 3
Google NotebookLM即将推出视频概览功能,通过一键转成教学视频改变知识付费格局。NotebookLM具有朴素风格和情感化视频产品线,引发内容创作者担忧。
Windsurf公司创始人与Google达成24亿美元交易,创始人和精英团队获益,数百名员工被留待「空壳」公司,且仅有100%股份作为补偿。谷歌获取核心技术许可,留给剩余员工的前景暗淡。多位科技评论员对此表示愤怒和不满。
VeO3 最新更新支持图片生成开口说话的视频,包括声音和动作。用户能上传一张静态图片加上文字脚本,就能生成带有语音同步的视频。Gemini 平台提供了多种选项如首帧转视频、使用 Gemini 和 Flow 生成连贯短片等。
近期开源了4个大模型:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型和DeepSeek-TNG-R1T2-Chimera专家组合模型,文章介绍了这些模型的特点及模型合并方案,并推荐MergeKit库来执行模型合并。
2025年上半年大模型API市场数据分析显示,Gemini-2.0-Flash、Claude-Sonnet-4等模型表现突出;谷歌在市场份额上占据主导地位,而OpenAI则存在波动。不同领域如编程、翻译和角色扮演中,各模型使用量各异。总体来看,谷歌与Anthropic的模型占据优势。
Google开源新项目genai-toolbox简化数据库集成,支持PostgreSQL、MySQL等主流数据库,通过统一的YAML配置文件定义数据源和工具集,开发者只需配置tools.yaml文件即可启动服务器并调用AI应用中的数据库工具。
2025年活动推荐,包括Google联合举办的AI工作坊、人工智能硬件科创大赛等。其中「从模型到行动」系列AI工作坊将在深圳、上海、北京三地举办;外滩大会组委会与将门创投发起的人工智能硬件科创大赛提供30万奖金吸引优秀团队参赛。