大型语言模型
AI比人类更会玩梗!模因图灵测试已被攻破,研究发现LLM表情包更搞笑
研究发现,LLM在创作梗图时表现出惊人的幽默感与创造力,甚至超越了人类创作者。AI创作的梗图评分更高,但最具灵魂的作品仍来自人类。
AI Agent真的安全吗?南洋理工最新综述揭秘LLM Agent安全风险与防御策略
A Survey on Trustworthy LLM Agents: Threats and Countermeasures, a study by researchers from Nanyang Technological University and Squirrel AI, categorizes Agent safety issues into internal (Brain, Memory, Tool) and external (User, Agent, Environment) modules. It provides insights for future research directions such as collaborative security mechanisms and adversarial robustness training methods.
一个算法让LLM创新能力暴增,原来是AI学会了进化
近日研究成果展示了如何利用LLM结合进化算法设计出新颖的创意时钟和纹理动画。该算法名为Lluminate,由Joel Simon提出,它结合了进化计算原理与大型语言模型。实验表明,使用形式化的创造性思维策略可以显著提高新颖性指标,而修改现有artifact比从头开始生成新artifact更多样化。
人大和阿里开源支持十万级节点图谱生成的框架GraphAgentGenerator
人大和阿里开源的GraphAgent是一个利用大型语言模型来模拟人类行为并生成动态社交图的框架,适用于在线社交媒体、电子商务和论文创作等场景。它通过生成带有文本属性的社会图,揭示网络中的互动,并在多个指标上优于现有方法。
迈向推理时代:大型语言模型的长链推理研究综述
MLNLP社区是一个国内外知名的机器学习与自然语言处理社区,旨在促进学术界、产业界和爱好者的交流合作。本文综述了长链推理的研究进展及其关键技术特性,并探讨了其在实际中的应用效果和未来研究方向。
港大开源论文AI撰写工具AI-Researcher,Gemma 3发布评测性能超越DeepSeek-V3部署成本少10倍
ini 2.0研发的轻量级开源模型系列,可在单GPU或TPU上运行,性能强大。
Gemma 3 是
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
斯坦福大学OctoTools框架通过标准化工具卡、规划器和执行器,无需训练即可显著提高LLMs处理复杂任务的能力,比其他方法平均准确率高出9.3%。