大模型
大语言模型
刚刚,GPT-4o 被官方承认翻车:变成了“赛博马屁精”?
最近OpenAI更新了其最新的语言模型GPT-4o,导致其个性变得过于谄媚和讨好。用户反映GPT-4o在回答问题时一味顺从、讨好,甚至在被批评时还能微笑回应。这引起了一些用户的不满。OpenAI表示正在加紧修复这个问题。
超越Flux,C站最受欢迎!
HiDream发布后迅速受到全球开源AI绘画爱好者的关注,其量化版本成为C站最受欢迎的真人大模型之一。HiDream是智象未来科技有限公司自主研发的图像生成大模型,具备图像生成和交互编辑功能,并在技术上实现了语义理解、算力优化及多模态融合等创新点。
文科生也能搞定编程和AI!DeepSeek助力零基础起飞全攻略
随着DeepSeek等AI工具的出现,编程和AI开发变得对所有人友好。文科生擅长理解需求、打磨细节和沟通协作,而这些正是AI开发中最稀缺的能力。通过自然语言交互、小步快跑式学习以及从小项目起步等方式,文科生可以快速进入编程与AI的世界,并利用AI助手创造自己的产品和服务。
爆料!DeepSeek R2即将发布:1.2万亿参数,成本暴跌97%,真王炸,还是空欢喜?
DeepSeek 新模型引发热议,混合专家模型 DeepSeek-R2 集齐 1.2 万亿参数和 780 亿动态激活参数,成本比 GPT-4 低97.3%,引发广泛关注。
英伟达送钱送算力!数据过滤挑战赛开启:白嫖A100,冲击1万美金大奖!
在英伟达、Lambda Labs 及 Turing.AI 联合举办的 Data Filtering Challenge 中,参赛者需设计数据过滤技术优化数据集,并提升边缘设备上的小语言模型表现。比赛提供免费 GPU 计算资源及丰厚奖金。
迈向长上下文视频生成!FAR重塑下一帧预测范式,短视频与长视频双双登顶SOTA
本文首次系统性地研究并提出了高效建模长上下文视频生成的方法,通过重构视频生成任务为逐帧预测,并引入长短时上下文的非对称patchify策略和多层KV Cache机制,实现了高效的长视频训练与长上下文视频生成。