开源
一个刚刚开源的浏览器翻译插件,支持DeepSeek等20+种翻译引擎!
最近发现了一款名为FluentRead的开源免费浏览器翻译插件,支持20+种语言和多种翻译服务,提供双语对照、自定义选项及跨平台兼容性。用户可以在Chrome、Edge和Firefox等主流浏览器中快速安装使用。
DeepSeek又杀疯了!真心建议冲冲这个新兴领域!
DeepSeek爆火重塑AI圈,仅需一小部分成本即可达到顶尖性能。企业接入AI成为必然趋势,2030年将有400万AI人才缺口。未来5年需要具备大模型应用开发能力的程序员,大厂内推机会让入局更轻松。知乎知学堂推出就业速成计划,涵盖技术原理、实战应用及职业发展等内容。
Agno:18.9K星标推荐!多模态智能体的轻量级框架,效率飙升10000倍
Agno是一个轻量级Python库,专为构建多模态智能体而设计。它提供了快速创建、模型无关性、多模态支持等优势,显著缩短了开发周期并增强了灵活性。
跃问APP开源的130B语音模型 Step-Audio,快手开源运动控制DragAnything,微软智能体入门10个免费课程
Step-Audio是首个支持多语言对话、情感表达和方言的开源智能语音交互框架;Frames of Mind项目通过思维链可视化思考过程;DragAnything实现对象运动控制;《AI Agents for Beginners》课程教授初学者构建AI代理技能;Chat2Geo结合遥感数据进行地理空间分析。
让Stable Diffusion当老师,教多模态大模型(如Llama-3.2)如何看图说话
中国研究员与DeepMind合作发布《Lavender》研究,仅需少量数据和注意力对齐技术便大幅提升多模态问答模型性能。
微软发布一个基于纯视觉的 GPU 智能体:OmniParser 2.0 版本
微软发布OmniParser 2.0版本,能将屏幕截图转化为LLM可读结构化元素,提高多模态大模型的视觉识别准确度,并支持与多种语言模型集成。
OpenAI 总裁 Greg Brockman 分享了一种高效的 o1 提示词撰写方法
OpenAI 总裁 Greg Brockman 提出了一种目标明确、要求清晰的 o1 提示词撰写方法,旨在提升工作与沟通效率。文章以旧金山徒步路线为例,展示了如何通过具体目标来筛选和优化徒步路线信息。