学术
仅仅一天,Gemini就夺回了GPT-4o拿走的头名
谷歌和OpenAI在大模型领域竞争激烈,近期Google的Gemini-Exp-1114和Gemini-Exp-1121模型迅速更迭Top榜单。有人担忧当前的人工智能基准测试方法可能简化了模型评估,引发对安全性和可靠性等问题的关注。
凑个热闹,测试一波DeepSeek新上的o1推理模型
MLNLP社区介绍了国内涌现的o1模型,并分享了一些测试结果。kimi的k0-math模型在数学和代码方面表现出色,但逻辑推理能力有待提高。社区呼吁开发者积极贡献开源模型,以超越OpenAI的技术水平。
NeurIPS 2024|收敛速度最高8倍,准确率提升超30%!华科发布MoE Jetpack框架
华中科技大学提出MoE Jetpack框架,利用密集模型预训练权重微调为混合专家模型,显著提升精度和收敛速度。
支持20+视觉任务,多项SOTA!可扩展多任务视觉基础模型LaVin-DiT:融合时空VAE与DiT
↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
模型
回顾PyTorch Eager Mode 量化 TensorRT 加速
本文介绍了如何使用TensorRT加速通过PyTorch Eager Mode量化接口生成的量化模型,包括量化步骤、修复ONNX模型图以及构建和验证TensorRT引擎等内容。