NLP工程化
AutoMouser:一个 Chrome 扩展程序,能跟踪用户的浏览器交互
AutoMouser是Chrome扩展程序,利用OpenAI的GPT模型自动生成Selenium测试脚本,简化自动化测试创建过程。
阿里巴巴达摩院发布了专注于图像和视频理解的多模态基础模型:VideoLLaMA 3
阿里巴巴达摩院发布VideoLLaMA3多模态基础模型,支持看懂视频内容、理解图片并能对话,基于Qwen2.5架构。
直接在本地运行的开源语音识别模型:Moonshine
Moonshine是Alibaba Cloud的开源语音识别模型,上线不到一周在GitHub上获得了1.4k星。它具有更小、更快、更准确的特点,支持断网运行,适用于现场场景,其计算需求与输入音频长度成比例。
DeepSeek R1 – 最强大的开源推理模型:包含经过蒸馏优化的 Llama 和 Qwen 模型
DeepSeek R1开源模型发布,包括Llama和Qwen蒸馏版本,支持GGUF格式和4位量化,7B模型压缩至4.68G。