DFlash是一个轻量级块扩散模型,专为Flash投机解码设计。它通过高效的并行草稿生成,显著提升大语言模型的推理速度和质量。该仓库提供多种主流模型(如Gemma、Qwen系列)的DFlash适配版本,适用于需要加速LLM生成的AI应用场景。
本仓库配套O'Reilly书籍,提供AI系统性能工程的代码、工具与资源。涵盖GPU优化、分布式训练、推理扩展及全栈性能调优。旨在帮助工程师通过剖析瓶颈、优化带宽内存及使用高性能编译器,构建高效可靠的AI训练与推理流水线。
本书配套代码库,通过从零构建PicoAgents框架,详解多智能体系统的设计原理与实现。涵盖从基础理论到生产部署的完整模式,提供透明、可测试的代码示例,帮助用户深入理解LLM驱动的多智能体应用开发核心逻辑。
Anybackup V9是一款AI原生的数据韧性平台,主打自主备份、恢复与优化。它通过AI代理工作流实现自然语言交互,旨在降低35%的总体拥有成本,替代传统被动式备份管理,提升数据保护效率与智能化水平。
Arkon是企业级AI知识库中心,支持自托管。它通过MCP协议将内部文档转化为结构化知识图谱,自动为Claude等AI客户端提供上下文,实现集中化权限管理与内容共享,解决员工使用AI时信息不一致的问题。
Claude-OSINT 是一套针对 Claude 的代码技能包,旨在将 AI 转化为高级外部侦察操作员。它包含方法论和战术模块,适用于授权的红队演练和漏洞赏金活动,提供结构化的侦察 tradecraft 和自动化脚本支持。
一个基于Claude Code的视频剪辑工具,可将长视频自动裁剪为适合社交媒体的短片。通过语音识别分析有趣片段,智能转为竖屏9:16比例并添加动态字幕,适用于访谈、播客等对话类内容。完全本地运行,无需云服务。
这是为Claude Code设计的企业级深度研究技能,包含8阶段流程,能生成带引用的研究报告,支持多搜索源集成和自动化验证,适用于快速检索到深度分析的研究需求。
XLeRobot是一个低成本开源移动家庭机器人项目,旨在推广具身AI应用。基于660美元预算和4小时组装时间,提供双臂移动机器人设计方案,支持家庭环境中的交互任务。
这是一个自动化交易机器人,专门用于Polymarket平台的天气预测市场。通过多源天气预报数据识别温度市场中的价格偏差,结合凯利公式计算预期价值并自动执行交易。包含止损、滑点过滤等功能,适用于全球多个城市。
这是一个计算机视觉研究项目,通过视觉几何Transformer模型实现异常视图的自动检测与剔除,旨在提升几何估计任务的鲁棒性。
这是一个用于WhatsApp的OSINT(开源情报)工具,通过RapidAPI接口获取目标用户信息。主要功能包括获取头像照片、验证企业账号、检查用户状态和信息、分析关联设备、查看隐私设置等,支持6个API端点。
专为J-Pop/City Pop优化的歌词转录工具。利用faster-whisper large-v3模型,结合人声分离、音频预处理及智能幻觉过滤,实现高精度转录。支持自动扫描音频、生成LRC/TXT文件,显著降低背景音乐干扰和识别错误。
NodeGraphQt是一个基于Python和Qt开发的节点图UI框架,用于构建可视化节点编辑界面。它支持通过pip安装,提供丰富的API示例和文档,适用于创建类似Houdini或Nuke的节点式图形用户界面应用,方便开发者快速集成节点逻辑与交互功能。
Frogmouth 是一个在终端中使用的 Markdown 浏览器,基于 Textual 构建。它支持打开本地或远程的 Markdown 文件,并提供类浏览器导航、历史记录、书签和目录功能。


