大模型
大语言模型
OpenAI开始撒钱了,撒的还是美元?!
木易分享了OpenAI推出的新政策:3级及以上账号可免费使用gpt-4o、o1、gpt-4o-mini和o1-mini模型,每日总使用量上限为1亿tokens。他指出这是为了获取宝贵的训练数据,并提醒用户保护个人信息。
Cursor是今年的最大黑马,颠覆才刚刚开始
Anysphere 完成 1 亿美元 B 轮融资,估值达 26 亿美元;其 AI 编程助手 Cursor 成为热门工具;公司收购 Tabmaven 并推出新版本以提升性能和上下文感知能力。
影响RAG检索效果的原因有那些?
RAG系统中检索环节存在问题包括数据质量问题、向量化表示、检索方法与算法等多方面因素,文章提出优化建议以提升其性能,如使用高质量嵌入模型、定期更新数据库及调整相似度度量参数等。
就在OpenAI摆烂时,谷歌又又出手了!谷歌牌o1模型发布!
木易分享了OpenAI与谷歌在AI领域的动态,特别是Google Gemini 2.0 Flash Thinking模型的表现及其免费可用性。Gemini 2.0 Flash Thinking在LMSYS排行榜上排名第二,并且无需数量限制即可使用。
南加大团队提出MARVEL:基于认知科学的多维抽象视觉推理基准测试
研究团队提出MARVEL数据集来评估多模态大语言模型的抽象视觉推理能力,该数据集中包含了770个高质量测试样例,并覆盖了六种核心知识模式、多样化的几何和抽象形状输入以及五种不同的任务配置方式。实验结果显示大多数模型在MARVEL上的表现接近随机水平,揭示出模型的视觉感知能力是提升其抽象视觉推理的关键瓶颈。