Kimi新论文再次“撞车”DeepSeek,都谈到了长文注意力机制
Kimi研究团队提出的MoBA注意力机制显著提升了处理1M和10M长文本的速度,相比传统方法快了6.5倍和16倍。MoBA通过将上下文划分为块,并采用参数无关的top-k门控机制选择最相关的块来高效处理长序列数据。
Kimi研究团队提出的MoBA注意力机制显著提升了处理1M和10M长文本的速度,相比传统方法快了6.5倍和16倍。MoBA通过将上下文划分为块,并采用参数无关的top-k门控机制选择最相关的块来高效处理长序列数据。
月之暗面Kimi因DeepSeek热潮暂缓‘烧钱’投放。近期大模型六小虎中有五家公司减少或暂停广告投放。月之暗面对推广动作进行相应调整,并推出新模型Kimi Latest,聚焦长文本输入与上下文长度控制。
月之暗面创始人被前一次创业的部分投资人申请仲裁一事闹得沸沸扬扬。朱啸虎质疑月之暗面与循环智能签署的拆分协议有效性并爆料张予彤持股问题,杨植麟回应称该股份是通过多年兑现方式获得,并非因董事会决议而拥有。对于仲裁内容主要集中在程序瑕疵和利益冲突两方面,最终判断认为该决议有效且张予彤未违反信义义务。
金沙江创投主管合伙人朱啸虎回应月之暗面创始人杨植麟和联合创始人张宇韬被提起仲裁事件,指出张予彤隐瞒重大利益冲突导致董事决议无效。
金沙江创投主管合伙人朱啸虎在朋友圈发文回应月之暗面争议,称‘分拆’循环智能项目月之暗面临时未获股东决议签字。文章指出张予彤隐瞒利益冲突、欺诈行为及被解雇等问题,引发广泛关注。
国内大模型初创公司月之暗面推出的新一代推理模型Kimi k0-math在数学能力上已实现对标OpenAI o1-mini和o1-preview,包括在中考、高考等基准测试中表现出色。该模型采用了强化学习和思维链推理技术,能够模拟人脑的思考过程,并能有效应对竞赛级别的数学题库。
kimi发布数学模型k0-math,可深入思考并展示解题过程。k0-math在多个数学基准测试中超过OpenAI的o1系列,并能详细解释其解题思路和决策过程。