豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1
字节跳动发布豆包1.5·深度思考模型,采用MoE架构,参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平,具备‘边想边搜’、视觉理解等实用能力。
字节跳动发布豆包1.5·深度思考模型,采用MoE架构,参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平,具备‘边想边搜’、视觉理解等实用能力。
谷歌发布Agent2Agent(A2A)开放协议,让不同开发者发布的智能体可以有效通信和协作,提升生产力,并有望降低多智能体系统的使用成本。
人大团队综述论文《大语言模型》编纂成书,获多位院士推荐。该书全面覆盖大模型训练与使用全流程,提供大量代码实战讲解及开发工具包,填补学术界一线知识和实践经验空白。
阿里巴巴通义千问发布新一代端到端多模态旗舰模型Qwen2.5-Omni-7B,支持实时处理文本、图像、音频和视频等多种输入形式,并在多模态理解基准测试OmniBench上表现优异。
谷歌发布的新一代Gemini 2.5 Pro在多项基准测试中超越OpenAI模型,尤其是在编程、数学和科学领域表现出色,并支持100万tokens上下文窗口。
谷歌对人工智能初创公司Anthropic的投资被限制在14%的股份且无投票权。尽管投资巨大(约217亿元),谷歌仍无法获得过多话语权。Amazon则通过多次巨额投资持有Anthropic超过63%的股份。
Anthropic完成35亿美元E轮融资,估值达615亿美元,与OpenAI缩小差距;此轮融资由Lightspeed Venture Partners领投,加速下一代AI系统的开发和国际扩张。
国家知识产权局宣布依法驳回63件与DeepSeek相关的商标注册申请,称部分企业为抢注热点商标谋取不当利益,将保持打击商标恶意注册行为的高压态势。
阶跃星辰与吉利联合开源两款Step系列多模态大模型:全球参数量最大的文生视频大模型Step-Video-T2和语音交互模型Step-Audio。这两款模型已在跃问APP内开放体验,支持中英文提示,并公布了详细的报告和技术方案。