北航推出TinyLLaVA-Video,有限计算资源优于部分7B模型,代码、模型、训练数据全开源

北京航空航天大学团队发布小尺寸简易视频理解框架TinyLLaVA-Video,其参数量不超过4B,在多个视频理解基准上优于7B以上模型。该项目开源模型权重、训练代码和数据集,并支持模块化设计和自定义训练策略,降低研究门槛。

飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了

文章介绍了DeepSeek-R1在多种场景下的应用案例,包括办公软件接入、文档处理、商品名称生成、文案写作和AI算命等。飞书通过整合DeepSeek-R1实现了便捷高效的多任务处理,并分享了使用教程。

DeepSeek外还有全球屠榜的Qwen 2.5 Max,看下它和o3-mini 的 PK

阿里云Qwen2.5-Max在最新排行榜上位列全球第七,并在数学和编程等领域表现出色。其功能强大且适应能力强,不仅继承了DeepSeek的通用能力优势,还通过垂直领域深耕开辟出差异化赛道。模型采用MoE架构及超大规模数据预训练等技术优化提升性能。

刚刚,奥特曼给出AGI三个判断:Scaling Law保持不变,没理由放缓投资

OpenAI奥特曼最新观察指出,AI能力与投入资源呈对数关系,并且使用成本每年降低约10倍。AGI将在2035年让每个人的能力达到当前全球总和的水平,但短期内生活变化不大。AI Agent将像虚拟同事一样与人类协作,未来可能无处不在。奥特曼认为,AGI的社会影响将是巨大的,但商业化仍需进一步讨论。