NLP工程化
llm-speedrunner:自动化LLM Speedrunning挑战基准
自动化LLM Speedrunning挑战基准,评估前沿LLM Agent复现科学发现和创新的能力,涵盖多种提示格式、实验设置和扩展框架。
TokenDagger:高性能实现OpenAI的TikToken,为大规模文本处理加速
TokenDagger加速OpenAI的TikTok实现,代码样本分词速度提升4.02倍,采用优化正引擎和简化BPE算法降低大词汇表损耗。
commands.py中的migrate_knowledge_vector_database()函数解析
wledge_vector_database()
函数的执行逻辑。源码位置:dify\api\com
commands.py中的migrate_annotation_vector_database()函数解析
otation_vector_database()
函数的执行逻辑。源码位置:dify\api\co
Protein-LLM-Survey:蛋白质领域的大型语言模型(LLM)研究综述
Protein-LLM-Survey综述了蛋白质领域的大型语言模型研究,涵盖序列、结构和功能预测等多领域应用,并提供了丰富的预训练模型和数据集资源链接。
Cosmos-RL:专为物理AI应用打造的灵活可扩展强化学习框架
Cosmos-RL 是一个为物理AI应用设计的灵活可扩展强化学习框架,支持大规模训练、集成HuggingFace模型和低精度训练等特性。
we-mp-rss:微信公众号订阅神器,一键生成RSS,轻松管理公众号内容
微信公众号订阅神器we-mp-rss,一键生成RSS,支持抓取与更新微信公众号内容,提供用户友好的Web管理界面,定时自动更新。