开源
智谱开源CogAgent AI自动屏幕操作,DeepSeek-V3低调但效果好到刷屏,AI个人简历的平台
本文介绍了5款AI模型和技术产品:CogAgent改进视觉语言模型的GUI代理;DeepSeek-V3参数量大的混合专家语言模型;Valley 2.0字节跳动开发的多模态大模型;devb.io简化生成开发者个人简历的过程;Memory Layers提供大规模分布式训练的参考实现。
AI数学辅导利器:MathtutorOnGroq,基于Groq构建,支持语音、实时计算、LaTeX渲染。
mathtutor-on-groq是一款基于Groq构建的高效AI数学辅导工具,结合语音识别与强大的数学引擎实时计算和展示公式及解题过程,适用于学习代数、微积分等数学领域。
今日软荐:AI一键生成配图:Napkin,让创意不再受限!
Napkin是一款通过AI技术将文本内容转化为视觉艺术的创意工具,支持Frame、Canvas等功能,适用于文章配图、PPT和视频制作等场景。
9.5k星星,近期爆火开源!一个质量超高的RAG和AI代理构成的LLM应用集合。
这个集合包含多个功能的Agent,如AI客服、法律团队和招聘团队等。它利用开源资源实现这些高级应用,并提供详细的功能特点介绍。
两个提高图片分辨率工具,抱抱脸开源Smolagents工具,使用多模态把pdf转成md
本文介绍了五个技术项目:Infinity,一种基于位的自回归图像生成模型;InvSR,用于灵活超分辨率的技术方案;PeterCat,为社区维护者和开发者提供的智能答疑机器人解决方案;Smolagents,简化构建和运行智能代理的轻量级库;以及Vision Parse,能够将PDF文档转换为格式化的Markdown内容的工具。
法律Agent: 多个agent模拟一个法律团队
AI Legal Agent Team 是一个模拟法律团队的应用程序,包含4个角色(研究员、分析师、策略师和负责人),用于分析合同、法律法规、风险评估和合规检查等。支持自定义查询,并使用Streamlit应用程序运行,需设置环境并上传PDF文件进行分析。