这是一个基于PyTorch从零构建类ChatGPT大语言模型的动手指南。仓库通过Jupyter Notebook逐步拆解并详细解释LLM架构的各个组成部分,如分词、嵌入和位置编码,帮助用户深入理解Transformer模型原理及实现细节。
该项目基于PyTorch从零实现Transformer模型,提供从数据下载到文本生成的完整LLM训练流程。用户可利用单GPU训练百万或十亿级参数的大语言模型,适合深度学习研究与教育实践。
rLLM是一个开源框架,用于通过强化学习对语言代理进行后训练。它支持自定义构建代理和环境,便于用户训练并部署代理以处理实际工作负载。该仓库为归档版本,新项目已迁移至新组织。
这是一个关于智能搜索技术的工作坊教程,主要演示如何使用代理式搜索(Agentic Search)进行上下文工程,通过LangChain等工具在Elasticsearch等多种数据源中实现智能检索和上下文扩展。
Cupid是一个生成式3D重建模型,能够从单张输入图像估计相机姿态并生成对应的3D物体模型,同时支持将3D物体重新合成到原始图像中。它具备处理尺度、位置和光照变化的鲁棒性,并能保留精细纹理。
该项目使用深度学习技术从图像中的文本识别字体名称。通过生成包含不同字体文本的图像数据集,进行ETL预处理,并训练分类模型来识别字体。包括图像生成工具、数据处理和训练流程。
这是一个字体识别项目,使用ResNet18神经网络模型,能够分析图像并识别其中使用的字体,测试准确率达到95%以上。用户可以通过HuggingFace平台在线体验。
TRIBE v2是一个预测人类大脑对自然刺激(视频、音频、文本)产生功能性磁共振成像(fMRI)响应的多模态深度学习模型。它将先进的文本、音频和视频模型集成到统一的Transformer架构中,用于计算神经科学的研究和实验。
这是一个面向初学者的生成式AI课程仓库,包含21节课的Jupyter Notebook教程,涵盖了从基础到应用的完整学习路径,帮助学习者掌握构建生成式AI应用所需的核心知识和技能。
FinGPT是一个开源金融大语言模型项目,专注于为金融领域提供自然语言处理能力。该项目通过训练并发布HuggingFace模型,支持金融数据分析、对话生成等应用,旨在替代华尔街封闭的LLM方案。
OVIE是一个单目训练框架,仅需单张图像即可生成新颖视角,无需多视角图像对监督,使用未配对的互联网图片进行训练,实现野外场景的新视角合成。
这是一个使用现代C++实现的Peter Shirley光线追踪教程项目,相比原版代码性能提升明显,支持多核渲染,可复现三本书中的所有场景,包含GUI和命令行版本。
AirLLM是一个优化大语言模型推理内存使用的项目,允许70B参数模型在单张4GB显存的GPU上运行,无需量化、蒸馏或剪枝。它支持在资源受限的环境中高效部署和运行大型模型,目前还能在8GB显存上运行405B参数的Llama3.1。
SteerViT是一个框架,可为任何视觉Transformer(ViT)模型添加通过自然语言指令来灵活调控其全局和局部视觉表征的能力。它基于预训练的ViT模型,使用户能够用文本描述指导模型关注特定的视觉特征或区域,增强模型的可解释性和控制性。
这是一个基于NVIDIA CUDA加速计算的量化投资组合优化开发示例,通过cuDF/cuML加速数据处理和场景生成,使用cuOpt求解器高效解决Mean-CVaR投资组合优化问题,并提供策略回测功能,显著提升计算速度,支持快速迭代的投资决策流程。


