DINOv3 是一个基于 PyTorch 的视觉模型实现,主要用于生成高质量的稠密特征。
PDF2Audio能够将PDF文档转换为音频格式的播客、讲座和摘要,结合了GPT模型进行文本生成和语音合成。
这个仓库是一个知识图谱生成器,利用大语言模型从文本中提取实体和关系,生成互动式可视化图表。
该仓库提供了一系列计算机视觉模型和技术的教程,包括基础架构和前沿模型,旨在帮助用户快速掌握相关知识。
该仓库旨在帮助用户构建一个全栈代理应用,结合React前端和LangGraph后端,实现动态搜索和反思推理,为用户查询提供支持和引用。
langgraph-deep-research是一个全栈应用示例,结合React前端与LangGraph后的代理,用于动态生成搜索词并进行全面查询,优化了工作流程和前端展示。
Slop Forensics工具包用于生成和分析语言模型输出中的过度表现词汇模式,支持数据集生成、模型重复词分析及构建系统树。
FinRobot 是一个开源的 AI 智能代理平台,专为金融分析设计,集成多种 AI 技术,以满足金融行业的多样化需求。
这个仓库提供11节课程,旨在帮助初学者掌握构建AI代理的基础知识与技能。
该仓库实现了DeepFont算法,用于通过深度学习识别图片中的字体,支持数据生成、训练和评估,同时提供Docker支持,以便用户轻松部署和使用。
Font_Recognition-DeepFont 是基于深度学习的字体识别工具,利用 Keras 实现从图像中识别字体,灵感来源于 Adobe 的 DeepFont 技术。
EDGS是一个基于PyTorch的3D场景重建方法,通过高效的稀疏初始化和快速收敛,实现高质量渲染,极大缩短训练时间。
Qwen2.5-VL是由阿里云Qwen团队开发的一款多模态大型语言模型,支持强大的文档解析和对象定位功能,旨在提升多场景和多语言文本处理能力。
该仓库实现了一个使用YOLOv8n模型的二维码检测系统,能够识别图像中的二维码,并提取其内容,支持简单的前端展示。
Cua是为计算机使用AI代理设计的Docker,允许AI代理在虚拟容器中控制完整操作系统并部署,支持本地和云端使用。


