OpenAI 急推 o3-mini 救场,实测与DeepSeek谁是最强推理大模型
OpenAI CEO发布o3-mini模型,主打低成本推理功能。与DeepSeek R1相比,o3-mini价格较高但性能不输。通过8道推理题测试对比,显示o3-mini在部分推理任务上表现不如DeepSeek R1。
OpenAI CEO发布o3-mini模型,主打低成本推理功能。与DeepSeek R1相比,o3-mini价格较高但性能不输。通过8道推理题测试对比,显示o3-mini在部分推理任务上表现不如DeepSeek R1。
DeepSeek在Hugging Face发布全新Janus-Pro 7B和1.5B版本,参数优化使其具备本地部署能力,并在文生图基准测试中超越DALL-E 3和Stable Diffusion 3-Medium。
临近春节,豆包1.5 Pro发布,包含基础模型、视觉和实时语音模型。测试显示其推理能力、视觉理解能力和语音识别能力均有提升,但仍有待提高。基础模型已开始灰度测试,其他两个模型已上线。
国产大语言模型军备竞赛正式启动!DeepSeek发布DeepSeek-R1及Kimi发布k1.5,对标o1不输o1。DeepSeek和Kimi均采用增强学习技术训练,并开源其模型。
小红书宣布翻译功能正式上线,支持多语言和网络用语一键翻译。新增的搜索结果图片翻译和优先英文筛选能力方便非中国内地用户。用户点赞效率提升和即时获取日本网友对新番吐槽的功能。不过,中英文混合笔记或图文结合图片外文情况无法直接翻译。
OpenAI宣布推出名为Tasks的新功能,支持用户定时获取股市行情和创作科幻故事,并通过邮件发送给用户。该功能目前仅面向Plus、Pro和Teams用户开放测试。
Grok APP版在苹果App Store上线,凭借逼真图像生成和推理能力迅速成为生产力应用中的明星。尽管存在一些槽点,如对某些问题的回答错误、文本重复等,但其总体表现仍获好评。
近日,DeepSeek官方发布移动端App,iOS和安卓版本均有。其主打快速响应(0.5秒内得出结果),并提供深度思考与联网搜索功能。使用体验佳,但偶尔会出英文思维链。目前可在各应用商店下载。