实测万相2.1,全球首个中文文字生成开源模型,吊打Sora了?

DeepSeek开源周内,阿里发布了Wan2.1模型。该模型支持文生视频和图生视频任务,并且采用了宽松的Apache2.0协议。万相2.1在VBench评测中表现出色,但在文本生成、物理细节理解和变形处理等方面仍存在不足。通过采用3D时空变分自动编码器(Wan-VAE),模型能在消费级显卡上运行并优化内存使用和生成速度。

DeepSeek开源周Day 3:DeepGEMM——300行代码性能飙升2.7倍,比英伟达更懂如何优化英伟达?

DeepSeek开源的DeepGEMM库在Hopper GPU上实现FP8 GEMM,最高可达1350+ FP8 TFLOPS。它仅约300行代码,设计简洁,性能表现与专家调优的复杂库相当甚至更好,在各种矩阵形状和模型类型上均保持优势。

让 LLM 来评判 | 设计你自己的评估 prompt

第三篇《让LLM来评判》系列文章总结了评估模型的通用设计原则,包括清晰的任务描述、精细的评分标准、加入推理步骤和明确输出格式等。同时,也提到使用成对比较、引用参考内容及思维链等方式提升评估准确性,并探讨了奖励机制和社区机制的作用。