GPT-4o级开源模型来了!MiniCPM-o:多语种情感控制的实时对话、仅8B、华人团队
华人团队发布的MiniCPM-o 2.6多模态大模型在视觉和语音方面表现优异,参数量仅8B。其平均得分70.2,在OpenCompass评测中支持1344×1344高分辨率图像处理,并能实时识别双语语音,且支持30多种语言。
华人团队发布的MiniCPM-o 2.6多模态大模型在视觉和语音方面表现优异,参数量仅8B。其平均得分70.2,在OpenCompass评测中支持1344×1344高分辨率图像处理,并能实时识别双语语音,且支持30多种语言。
OpenAI更新函数调用文档,引入软件工程最佳实践。精简50%文档,新增清晰函数定义、减少模型负担、合并函数、提供示例等内容。新版指南受到开发者好评,被比作Stripe文档水平。
谷歌研究团队推出的新架构Titan通过模拟人类的记忆系统,不仅增强了AI处理长文本的能力,还超越了GPT-4等超大模型。Titan采用惊喜度评估机制、遗忘机制及多种记忆融入方案,展示了优异的性能和潜力。
Meta计划在2025年前使用AI完全替代中级工程师岗位,年薪六位数以上的职位或成为历史。扎克伯格表示,AI代理系统将成为这场变革的关键转折点。这一趋势引发科技界热议,有人乐观拥抱、有人保持怀疑。AI系统正在展示自我进化能力,并影响到行政工作等非技术领域。
Cursor.ai推出的新功能「Bug Finder」每次推理收费2.83美元,通过分析代码变更来帮助开发者提前发现潜在问题。但用户体验反馈不一,AI辅助开发正逐渐改变开发流程。
o1系统因其独特的技术特点,被一些用户视为高级报告生成器而非聊天工具。为了充分利用o1的能力,用户需要转变思维方式,并通过明确目标、指定格式、提供背景信息等方法与之互动。尽管存在风格固化和应用开发方面的局限性,但o1在代码生成、查询语言处理以及医疗诊断等方面展现出惊人的能力。此外,它还可能成为未来数据分析任务和其他复杂系统设计的新工具。
UC Berkeley发布Sky-T1-32B-Preview模型,在多个基准测试中与OpenAI的o1-preview平分秋色。该模型采用三步走战略:数据筛选、高效训练和全面评测,最终总成本不到450美元。研究显示高水平AI研发不需要天价预算,为社区开源贡献了力量。
最近AI领域突显显著进展,包括OpenAI发布的O3模型在推理者类AI中的领先地位。其突破涵盖高级知识测试、数学难题及跨领域的智能体应用,展示出强大的实用价值与潜力。专家警告称此次变革可能对社会产生深远影响,并强调需尽快准备和适应AI技术的发展。
Sam Altman 在社交媒体上分享了他对即将发布的O3模型的看法,并引发热烈讨论。他认为O3模型会很快改变人们的生活方式,但也可能因此被忽略。一些技术专家和个人用户表达了对AGI到来的期待和反思。