大模型
大语言模型
神经网络技术栈介绍——PyTorch,Transformer,NLP,CV,Embedding
文章介绍了神经网络的基本概念及其在不同任务领域中的应用,包括RNN、CNN和Transformer等模型。指出PyTorch和TensorFlow是实现这些思想的具体工具,并强调了神经网络与自然语言处理(NLP)和计算机视觉(CV)任务结合的重要性。同时提醒学习者不要过分依赖神经网络技术来解决NLP和CV的问题。
DeepSeek-R1隐藏玩法:比Kimi更强的“深度搜索”模式!
木易是专注于AI领域的公众号作者,分享AI全维度知识。近期发现DeepSeek-R1结合深度思考和联网搜索功能后效果显著,远超国内另一大模型阿里通义千问。
谷歌新推理模型重磅来袭:百万上下文,代码执行,推理能力飙升!
木易是互联网技术产品经理,专注于分享AI知识和工具。近期谷歌发布的新模型Gemini-2.0-Flash-Thinking-Exp-01-21,具有100万tokens上下文窗口、原生代码执行等功能,助力提升推理能力和输出长度。这是AI领域内的一个重要进展。
吊打ChatGPT,脚踩Claude:DeepSeek 自我介绍
大模型已成为中国AI研究主流。DeepSeek在中文语义处理方面表现出色,成功翻译了俄罗斯教授的经济学导论。DeepSeek还提供了文本生成、分类与情感分析、问答系统等多样的功能。
最烦写User Story
在 Linear,他们摒弃了用户故事的做法,转而直接写简短的问题来描述任务。重点在于让执行者明白要做什么,并且确保团队成员能轻松理解背景和内容。文章还强调了清晰简洁的写作方式、注重用户体验以及由熟悉细节的人编写问题的重要性。
国产模型如何追上多模态OpenAI o1?你需要知道的全在这
Kimi 团队发布了最新的多模态推理大模型 Kimi k1.5,其性能与正式版 o1 最为接近。通过 Long2Short 技术,该模型能够在有限的 token 预算下实现高性能推理,提升用户体验和资源利用效率。
354篇参考文献!史上最详尽综述:视觉定位任务十年发展系统性回顾
本综述系统性回顾了视觉定位(Visual Grounding)任务过去十年的发展历程,涵盖多种设置如全监督、弱监督、半监督等,并分析了各种数据集的表现。