LLM 自回归+Diffusion Loss?Orthus:仅需72小时训练时间,即可高精度多模态生成
型
Orthus,可同时生成离散文本和连续图像特征。其通过特定的扩散头和语言模型头分别处理图像和文本
型
Orthus,可同时生成离散文本和连续图像特征。其通过特定的扩散头和语言模型头分别处理图像和文本
CMU Infini-Al-Lab 研究人员提出 Multiverse,一种支持原生并行生成的新型生成模型框架,显著提高大语言模型的推理效率和速度。
首届‘隐语杯’大赛由蚂蚁密算与浙江大学联合举办,聚焦医疗大模型隐私微调、密态大模型推理保护及全同态加密KNN应用三大方向。2025年第二届赛事即将启动,设置12万奖金池和多项奖项,并强调社会多方合作推进数据要素安全创新。
谷歌研究人员提出’充分上下文’概念,通过自动评估器区分充分与不充分上下文来提升LLM准确性和可靠性,提出选择性生成框架优化RAG系统性能。
近期发布的团体标准指出部分智能体存在滥用手机系统底层敏感权限的嫌疑。为了执行第三方App指令,智能体可采取调用API接口或视觉识别两种技术路径。新的团体标准《智能体任务执行安全要求》禁止智能体利用无障碍权限操作第三方App,并要求通过双重授权来执行任务。
MiniMax发布首款推理模型M1,支持最高100万Token上下文输入和8万Token推理输出,采用混合专家架构及闪电注意力机制。其训练阶段仅需512张英伟达H800 GPU三周完成,成本仅为384万元人民币,提供低廉API服务。MiniMax采取区间定价策略,并透露该模式加速AI智能体大规模应用。