嚯!大语言扩散模型来了,何必只预测下一个token 人大高瓴&蚂蚁
人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。
人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。
DeepSeek与OmniParser V2.0结合,使得大模型能直接操控计算机系统完成复杂任务,引发人机交互范式迁移和智能体进化。
VisionAgent开源项目通过智能代理框架和先进大语言模型简化了计算机视觉任务处理。用户只需用自然语言描述需求,就能轻松实现各类视觉任务,大幅降低技术门槛,适用于安防监控、工业检测及医疗影像分析等领域。
OpenAI的Deep Research收费200美元,作者David发布开源版本Deep-research,6天收获1万颗星。该项目通过搜索引擎、网络爬虫和大语言模型进行迭代式深度研究,提供智能查询生成、深度广度控制等功能,并在GitHub上获得巨大反响。
Scira 是一款简约的人工智能搜索引擎,帮助用户高效获取互联网信息;DeepSearcher 结合大型语言模型和向量数据库提供准确搜索答案;本地RAG问答系统支持PDF文档解析和自然语言问答,并新增联网搜索功能;LangGraph Multi-Agent Supervisor 提供创建多层次多代理系统的Python库;Stock Data Insights Application 利用LLMs从新闻和金融数据中提取股票市场洞察。