CityGaussian系列提供基于高斯泼溅的大规模场景高质量重建与实时渲染方案。包含V1和V2版本,分别发表于ECCV 2024和ICLR 2025,旨在实现高效且几何准确的三维城市级场景重构,支持Web可视化查看。
CLIP是OpenAI开发的对比语言-图像预训练模型,能根据自然语言指令从图像中预测最相关的文本片段。它具备零样本学习能力,无需针对特定任务优化即可实现高精度图像分类与图文匹配,广泛应用于计算机视觉领域。
这是一个由Omar Santos维护的综合网络安全资源库,涵盖伦理黑客、漏洞研究、DFIR、AI安全及红蓝对抗等领域。提供脚本、工具、实验室构建指南、认证路线图及培训参考材料,旨在为安全从业者和学习者提供系统化的实战与理论支持。
Qbot是一个AI驱动的量化投资研究平台,支持完全本地部署。它提供自动交易、策略回测及数据分析功能,旨在帮助用户构建自动化交易系统。项目基于Python开发,适合对量化交易和人工智能应用感兴趣的用户进行本地化部署和研究实践。
Claude Cookbooks 提供基于 Jupyter Notebook 的代码示例与指南,帮助开发者利用 Claude API 构建应用。内容涵盖分类、RAG 等实用技巧,旨在通过可复制的代码片段加速集成,提升开发效率。
这是一个从零开始构建现代大语言模型的交互式教程。通过12章内容、7500+行代码和详细注释,以极简方式讲解Transformer架构原理及实现细节,涵盖分词、注意力机制、训练循环等核心模块,适合希望深入理解LLM底层技术的开发者学习。
帕德博恩大学强化学习课程的开源教学资料,包含讲义、教程任务及解答、在线视频。旨在为学生自学或讲师开课提供完整资源,支持自定义课程搭建。
这是一个基于PyTorch从零构建类ChatGPT大语言模型的动手指南。仓库通过Jupyter Notebook逐步拆解并详细解释LLM架构的各个组成部分,如分词、嵌入和位置编码,帮助用户深入理解Transformer模型原理及实现细节。
该项目基于PyTorch从零实现Transformer模型,提供从数据下载到文本生成的完整LLM训练流程。用户可利用单GPU训练百万或十亿级参数的大语言模型,适合深度学习研究与教育实践。
rLLM是一个开源框架,用于通过强化学习对语言代理进行后训练。它支持自定义构建代理和环境,便于用户训练并部署代理以处理实际工作负载。该仓库为归档版本,新项目已迁移至新组织。
这是一个关于智能搜索技术的工作坊教程,主要演示如何使用代理式搜索(Agentic Search)进行上下文工程,通过LangChain等工具在Elasticsearch等多种数据源中实现智能检索和上下文扩展。
Cupid是一个生成式3D重建模型,能够从单张输入图像估计相机姿态并生成对应的3D物体模型,同时支持将3D物体重新合成到原始图像中。它具备处理尺度、位置和光照变化的鲁棒性,并能保留精细纹理。
该项目使用深度学习技术从图像中的文本识别字体名称。通过生成包含不同字体文本的图像数据集,进行ETL预处理,并训练分类模型来识别字体。包括图像生成工具、数据处理和训练流程。
这是一个字体识别项目,使用ResNet18神经网络模型,能够分析图像并识别其中使用的字体,测试准确率达到95%以上。用户可以通过HuggingFace平台在线体验。
TRIBE v2是一个预测人类大脑对自然刺激(视频、音频、文本)产生功能性磁共振成像(fMRI)响应的多模态深度学习模型。它将先进的文本、音频和视频模型集成到统一的Transformer架构中,用于计算神经科学的研究和实验。


