今天,我们谈一谈技术和产品的事儿,很有趣。
随着大模型落地应用的逐步进行,垂到某个特定的领域,做个深度的结合,并且从用户的角度出发去解决问题,这个受欢迎的概率以及成立性会高一些。
而在众多方向当中,开源项目或者私有项目代码分析和解读,其实是值得探索的一个。作为一个程序员,每天都在跟代码打交道,也会经常去看一些开源项目,并且会去分析它,开源代码,并且很希望知道“这个项目好在哪里”、“如何学习它”、“如何复刻这种好”。
因此,如何在这个方向上做一些有趣事儿,模型也好,产品也可,难能可贵,尤其是在思路的创新上。最近看到一个比较不错的产品,自己试下来是有一种很好玩,很有用的感觉的,分享给大家。
一、先看一个蛮有趣的产品
最近看到一个产品,用了下,实话说,还蛮激动的,因为做的真的蛮用心的,至少作为程序员的我,还是觉得这种产品又技术,又好玩,设计思路很好,先抛个链接,我的一个开源项目https://github.com/liuhuanyong/QASystemOnMedicalKG,改成https://zread.ai/liuhuanyong/QASystemOnMedicalKG,就可以看到。

坦白讲,这个项目是我自己的写的项目,但是出来的结果,比我作为作者写的都好。
例如,对这个项目做了技术实现流程和入门指南的整理。
又如,关于其中的热议部分:

又如,关于其中的issues部分,以及与其他github项目(主动引用了这个项目)的信息都拿到了。!!

甚至,这个也是惊呆了,作为关于团队,都将相关信息都做了收集,也就是说,这个产品,集成了其他数据源。

所以,说下最终结论,我越发觉得,这不单单是一个代码项目解读产品,其实是把AI搜索也加进去了,做了个信息互联!。
那么,这个东西既然这么做,是不是可以详细看看背后的实际逻辑?
二、从开源Github项目到内部项目看代码开发痛点
实际上,我们苦“代码屎山”矣,无论是外部开源项目,还是在公司内部,入职新公司接受旧代码,还是内部研发协作,对接代码,都会涉及到这种代码上的 “开发之痛” 。
我们展开来讲。
先说外部,也就是Github开源项目。
Github开源项目是我们工程开发、算法研发以及产品设计等的重要思路来源和生产力来源,其凭借着众多优秀开源工作者的分享,我们可以从中获取到开源的数据、可用的工具组件、可用的算法模型、产品设计思路、工程架构思路,甚至完整的系统,Github俨然成为一个诺达的宝库。
但是,纵然它是一个宝库,但是挖掘和高效利用绝非易事。
1、项目同质化严重,难以区分,难以发现好项目
对于同一个主题的开源项目众多,单纯依靠star、for、issues的数据指标不足以作为很具有参考意义的组件。但是,在我们的日常开发过程当中,又总是要进行技术选型,就需要对业界开源的技术方案进行调研。
而整个技术调研的工作是需要花费大量时间的,因此,如何从众多同质化且日益更新的项目库中选择出合适的项目显得尤为重要。而到了传播层,正因为项目同质化严重,难分优劣,技术传播困难,目前的仓库文档缺乏引导性,很难直观地展示项目为什么优秀,限制了好的实践的普及和复用。
因此,概括起来,就是一个选择难的问题。
2、项目质量层次不齐,文档阅读难
实际上,我们在跟进一个开源项目的时候,第一层级是为了能够用起来,但用起来的前提是能够对这个项目的设计、构成、描述等诸多信息有个较为全面的了解。
但是,项目的说明文档质量常常写的并不清晰,甚至常常出现readm文件为空的情况,因此,以至于当我们想对一个项目有个清晰的认识显得很困难。
这样一来,代码库理解壁垒本身就高,普通用户难以直观掌握精髓,难以快速进阶,知识流动性差。开发者或产品经理做技术调研需花费大量时间才能理解真正的精华所在。
这个概括起来,是一个项目的分析问题。
3、项目研读记录性不足,不利于交流
实际上,当我们在研读一个开源项目时,目标是通过阅读说明文档、代码,来提炼项目实现逻辑和设计思路。这在某种程度上其实也是文献阅读的范畴,就必然会涉及到要做一些阅读学习笔记的记录,重点的标记、自己的心得体会,就如微信读书一样。
而这些记录也并不够,其还有另一层分享的意思,尤其是公司内部人员在进行调研时候,可以将调研的结果进行分享,这样会好一些。此外,有些文档的说明文档可能存在错误的地方,如果识别到错误,然后进行修正提醒,可以方便后续人员排坑,排雷。
这个概括起来,就是一个项目的学习、记录、分享问题。
再说内部,内部公司研发上的一些感受。
除了Github开源项目之外,我们在公司内部也往往会有内部的代码系统,其中也包含了各种项目代码,也同样存在如上的问题,并且表现的更为突出。
例如:
1、产品文档(API文档、用户手册)创建和更新繁琐,工作重复性强,创造性低,经常被技术人员视为DirtyWork,对中小型团队来说很难随着产品迭代持续更新。
2、好的技术文档时间成本高,导致公司内部技术留痕少,部门内开发经验难以跨团队复用,这一点其实很常见。
3、新成员入职时间成本较高,依赖老员工讲解或自己分析阅读熟悉项目代码,需要一周到一个月左右适应期,有的时候甚至老员工梳理项目代码也困难,年久失修的情况时有发生。
三、再看我对代码项目解读产品有什么期待?
上面已经说了许多现实的痛点,作为一个程序员,其实是很期待有这种产品出现的,说下我的期待。
首先,这个产品能够对开源的项目进行索引整理,并且很方便操作,输入开源项目或者自己的代码仓库,能够生成对这个项目的分析报告,可以以页面方式呈现。
在这个页面里,能够对项目进行整体介绍,类似于生成wiki页面的思路,具体包括项目的用途,版本变更,代码的代码处理逻辑、环境依赖、采用的技术架构进行整理分析展示。
其次,这个产品可以针对某个主题进行整理并推荐一些整理好的项目,例如,现在大模型其实有很多的方向,如大模型微调、大模型强化训练、RAG、Agent等,我们其实很迫切地知道这些方向都有哪些值得关注的项目,而这些项目,其实应该还可以进行对比,同一主题下,哪些项目较好,其差异性是什么,这个对于技术选型调研很方便。其实能够节省很多时间。
然后,能够整理并且呈现一些大家对这个项目的思考、使用感受以及建议。按照往常的方式,为了获得对某个项目的真实情况(跟它readme 所描述的往往不同),回去看issues,但issuse中的数量很大,挨个点进去看其实也很费力,里面的内容质量也参差不齐,这个时候,如果能过对其进行整理出来,是个很棒的事情。大家的使用感受是什么?这个可以从另一个角度,增强对某个项目的认识程度。
最后,还是上面说到的学习问题,学东西不在广度,而在于深度,在这个产品中,其可以生成对这个项目的解读报告,而读这个报告的过程中,可以对这个报告做笔记,做一些信息的补充,甚至纠错。实际上,我深知现在利用大模型进行整理和分析出来的结论很多时候并不可靠,充斥着幻觉的问题。而既然是幻觉问题,那么专业的人就可以进行修正、补充,并且将修正的结果保存下来,保存下来之后,再进行分享,这个其实对于这个产品本身而言,也会大有裨益,能够携手共创一个不错的生态。
四、Zread.ai是怎么解决我的这些问题的?
讲完痛点、期待之后,还是要看下是否能够被实现。
目前随着大模型技术发展,其能力有了较大的提升,各行各业、各个方向,其实也在积极的开展基于大模型做一些应用探索。
例如,之前的deepwiki项目,其实就是在代码整理解读方面做的探索,也很受欢迎。
但是,使用的过程发现,一方面,其效果并不太如意,对于代码整理这个任务而言,其实并没那么容易做,本质上而言,其实是目前AI模型缺少对架构、技术方案最佳实践的有效学习,导致模型生成项目的可维护性不佳。此外,其中有些功能还不足以支撑上述的几个期待。
因此,有了一个新的产品,Zread.ai,其确实做了一些不错的点。
从产品的定位上讲,Zread.ai想解决“知识传递与再创造”问题,希望把“读懂优秀代码”升级为“复制优秀、再造更好”,类似于知识生态的意思。

其实现思路在于,通过结构化的代码分析、深度知识萃取与多维度社区洞察,一键生成清晰易懂的仓库Guide,帮助开发者轻松掌握优秀项目背后的核心知识和方法论。
来细看下,他有哪些功能。
1、一键即达:快速生成可用的Documentation
可以API文档、用户手册,快速帮企业完成产品文档的建立,一键生成仓库说明书,API调用文档,方便他人协作,这样的话,对于内部公司来说,快速接手屎山代码,无痛入职,梳理技术框架,提炼出技术沉淀,促进内部研发迭代效率。

例如,当我们想对某个项目生成一个介绍文档时,就可以直接进行添加,例如为github项目:https://github.com/liuhuanyong/QASystemOnMedicalKG,进行添加,然后可以生成对应的分析报告页面,然后稍等一定时间后,完成后可以直接通知。
而对于别人已经分析好的项目链接,如针对browser-use这个项目,则可以直接使用。

在完成后,可以直接展示,如下,为每个项目生成了一个详细的wiki页面。

2、代码运行角度,做Deep Research式的详细分析
解决不同开发者对仓库的疑问,所以,会从不同的角度对这个项目进行解读,这个主要放在开始使用这个模块上。
例如,在基础概述上,包括对项目代码的基础概述,介绍项目的功能、其还给出了预计阅读时间、所属等级等信息。


从其中的核心功能、工作原理、关键组件等,可以很好的了解这个项目。
又如,快速入门指南以及安装配置上,一个很棒的点,指导快速入门,如何快速的运行,这个解决了开源项目使用的最直接需求。
还是以browser-use这个项目为例,其给出的指引是:几分钟内开始使用Browser Use本指南将帮助您安装库、设置环境并运行您的第一个AI浏览器自动化任务

其中比较重要的还包括环境依赖问题,这个在运行过程中十分重要,大家在跑开源项目中最头疼的问题就是配置问题。

3、打通AI问答跟搜索定位,提升项目研读效率
梳理出来的wiki是固定的,那么,还可以将人机交互的问答集成进去,可以进行提问,系统会针对输入的问题,先进行think,然后再得到答案,如下图:

有一种读论文的感觉。
此外,由于整个文档内容很多,其实搜索定位很有必要,如下,可以进行搜索指定内容定位到原文:

4、第三方视角,评估并挖掘项目的体验及团队
热议这个功能,情绪价值给到位,在跟进这个项目的同时,更进一步,看看趋势热点。
例如,在项目页面中,项目的资讯和用户评价,看看这个项目有哪些独特亮点、相关资讯、用户怎么说、以及背后的团队故事。

从中可以看到浏览器自动化领域正在升温,而browser-use正处于这场风暴的中心等大趋势。
说到这,就不得不说这个 “大家都在说” 功能,这个点充分地满足了我上面提到的issue的整理需求,从实际用户角度做的一些整理工作,很客观,很不错,其对“issue”做了整理,并且还做了引用。


当然,还可以关注团队,这个对于想知道背后的开发团队的一些介绍,找到一些志同道合的朋友其实又很有帮助,这个是打通了研发者介绍这一层的信息差?很棒。

此外,在浏览别的模块时,可以通过点击最新动态来跳转。

5、技术工程角度解构项目实现、代码解读
项目架构分析和代码解读,是从技术角度对一个项目进行分析,通过对其实现架构的绘制,以及组成组件、数据流、如何交互,如何扩展的,如何在工程上设计的,也很清晰可用,如下图中的细分分析项,很全面。
当然,作为算法和工程研发人员,最喜欢的,莫过于其中的各种系统架构图,一图胜千言。
如,系统架构图:

数据执行流程图:

6、看趋势+做推荐+做聚焦:Github trending
这个功能值得看看,那就是做Github trending的功能,这个更是把技术之外的情绪价值引入了,以仓库指南的格式,可以拆解 GitHub Trending上爆火项目的背后故事,入口方式是在首页点击探索本周的热门仓库。

从这个趋势中,可以发现各个热点项目,而点击热点项目,可以深入了解项目本身的一些信息。

7、学习+创作+分享拉满:评价总结、写评论坐做记录
社区评价总结、贡献者图谱、写评论,这个引入了欢乐的元素,更是“吃瓜”的属性,在阅读过程中,提供划线和笔记的功能,支持记录和共享开发者的深度思考,促进团队内知识共享和高效协作。
也可以进行社交,了解关注近况,发现圈子趣闻,同时将鼠标选中自己感兴趣的位置可以进行【划线】【写想法】【分享】【提问】,这个设计思路真不错!

可以划线、添加想法:

添加想法后很好进行分享,这很利于后期分享:

例如,分享后,可以生成Card,这也很好传播。

五、Zread.ai产品的几个核心点总结下?
上面讲的都是具体的实验体验,但实际上,从一个程序员的角度,还是更想知道其背后的技术,这样就闭环了,我在这里做几个总结。
1、结构化Guide生成
通过自动索引与分析整个仓库代码,生成直观易懂、教育导向的结构化Guide,包括项目核心思想、架构图示、核心模块原理和关键代码实现,帮助开发者迅速掌握优秀项目的精华与价值,这点蛮不错。
2、Buzz&Backstory
分析代码仓库在社区中的评价,对项目进行深度调研,包括项目创始人背景,最近出色的更新,用户使用评价,帮助开发者了解项目最真实全面的信息。
3、自研DeepResearch框架
深度研究(DeepResearch)模式调用多工具链Agent,通过语义检索、结构分析与网络资料整合,自动挖掘项目背后的优秀实践与技术方法论,明确地告诉开发者 “这个项目好在哪里”、“如何学习它”、“如何复刻这种好”。
4、笔记和划线
在阅读过程中,提供划线和笔记的功能,支持记录和共享开发者的深度思考,促进团队内知识共享和高效协作。
5、为Agent提供更好的Context(接入MCP):
六、那么,我们该如何体验并使用Zread.ai呢?
讲了这么多,纸上得来终觉浅,绝知此事要躬行,我们还是要自己去做尝试。在使用上,很方便,有3种方式,大家可以去用用:
方式1:在Zread.ai首页输入GitHub仓库链接,一键生成Guide

方式2:创建个人或团队空间,授权上传私有项目,一键生成Guide

方式3:修改Github链接,替换域名
只需将GitHub仓库URL中的“github.com”替换为“zread.ai”,即可访问该仓库的分析页面。
例如,https://github.com/liuhuanyong/QASystemOnMedicalKG,改成https://zread.ai/liuhuanyong/QASystemOnMedicalKG即可:

参考文献
1、https://Zread.ai/
2、https://github.com/liuhuanyong/QASystemOnMedicalKG
3、https://Zread.ai/liuhuanyong/QASystemOnMedicalKG
4、https://Zread.ai/browser-use/browser-use
one more thing
对了,Zread打算26号在WAIC办一个活动,欢迎大家去参加。
体验链接,可以点击原文
(文:老刘说NLP)