MolmoWeb是一个开源的多模态网页智能代理,能够理解自然语言任务并自主控制浏览器(点击、输入、滚动、导航)完成任务。包含代理代码、推理客户端、评估基准等完整资源。
Jupyter Notebook
419
54
Apache License 2.0
5天前
SceneGen是一个基于单张图像快速生成3D场景的AI模型,通过前向传播一步完成3D场景生成。提供完整的PyTorch实现,包含训练、推理代码和预训练模型,适用于3D内容生成研究与应用。
Jupyter Notebook
320
18
MIT License
1周前
Mengmouxu/SceneGen cover
这是一个基于Transformers和Optimum的Whisper音频转录CLI工具,通过flash-attn等技术实现极速本地转录,可在不到98秒内转录2.5小时音频。
Jupyter Notebook
12,376
909
Apache License 2.0
4天前
这是一个包含OpenVINO™工具包教程的Jupyter Notebook集合,用于学习和实践深度学习推理优化。它提供了从基础到应用的代码示例,帮助开发者快速掌握OpenVINO API的使用。
Jupyter Notebook
3,088
1,014
Apache License 2.0
6天前
openvinotoolkit/openvino_notebooks cover
GTSAM是一个用于机器人和计算机视觉的C++平滑与建图(SAM)库,使用因子图和贝叶斯网络作为核心计算范式,替代稀疏矩阵方法,主要解决位姿估计、SLAM等问题。
Jupyter Notebook
3,363
919
Other
5天前
TADA是一个开源的语音语言模型,通过文本-音频双重对齐框架,实现高保真语音合成和生成。它采用创新的分词器与架构设计,将语音和文本同步为统一流,显著降低计算开销,适用于多种语音处理任务。
Jupyter Notebook
953
99
Other
4天前
HumeAI/tada cover
LocoOperator-4B是一个基于Qwen3-Coder-Next蒸馏的4B参数代码库探索智能体,旨在作为本地副代理,实现快速、零API成本的代码库导航和分析。
Jupyter Notebook
150
9
MIT License
1周前
LocoreMind/LocoOperator cover
这是一个基于迪杰斯特拉算法的追捕模拟项目,模拟小偷(车A)和警察(车B)在加权有向图上的追逐场景。项目包含动态事件(交通堵塞、道路封锁、单向通行变化)的模拟,并提供可视化和日志记录功能。
Jupyter Notebook
5
0
2周前
这是一个RAG投毒安全实验项目,通过将恶意数据注入向量数据库来演示如何污染检索增强生成系统。包含Flask界面、FAISS向量存储和轻量级演示,帮助学习RAG架构、攻击面、投毒技术及防御策略。
Jupyter Notebook
5
0
2周前
urcuqui/rag-poisoning-lab cover
TorchCode是一个用于PyTorch算法实践的Jupyter Notebook项目,通过从零实现softmax、注意力机制和GPT-2等核心算法来强化面试技能,提供自动评分功能,可自托管或在线使用。
Jupyter Notebook
3,378
278
5天前
提供100多个针对各种大语言模型进行微调的Jupyter Notebook教程,涵盖数据处理、训练、评估和模型保存,主要支持Google Colab和Kaggle平台,帮助用户快速上手微调实践。
Jupyter Notebook
5,147
825
GNU Lesser General Public License v3.0
5天前
DEIMv2是基于DINOv3特征增强的实时目标检测框架,提供从超轻量到大型的多种模型尺寸,在COCO等基准测试中达到先进性能,适用于需要高效物体识别的场景。
Jupyter Notebook
1,585
171
Other
3周前
这个仓库是《AI Engineering》一书的配套资源库,为AI工程师提供学习材料,包括章节摘要、学习笔记、实用工具示例和案例研究,帮助开发者掌握基础模型的应用和工程实践。
Jupyter Notebook
14,282
2,067
3周前
chiphuyen/aie-book cover
该仓库使用AI技术检测图像中的成人内容并进行过滤,基于YOLO v11和HuggingFace预训练模型,提供图像识别与过滤脚本,可用于内容审核等场景。
Jupyter Notebook
12
1
GNU General Public License v3.0
1个月前
这是一个基于计算机视觉和深度学习的实时手语识别系统,使用OpenCV和TensorFlow/Keras框架。它能识别美式手语(ASL)手势并将手语转换为语音,帮助残障人士进行沟通。
Jupyter Notebook
138
101
MIT License
3周前

ホーム - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-10 17:17
浙ICP备14020137号-1 $お客様$