TADA是一个开源的语音语言模型,通过文本-音频双重对齐框架,实现高保真语音合成和生成。它采用创新的分词器与架构设计,将语音和文本同步为统一流,显著降低计算开销,适用于多种语音处理任务。
Jupyter Notebook
935
99
Other
4天前
HumeAI/tada cover
LocoOperator-4B是一个基于Qwen3-Coder-Next蒸馏的4B参数代码库探索智能体,旨在作为本地副代理,实现快速、零API成本的代码库导航和分析。
Jupyter Notebook
149
9
MIT License
6天前
LocoreMind/LocoOperator cover
这是一个基于迪杰斯特拉算法的追捕模拟项目,模拟小偷(车A)和警察(车B)在加权有向图上的追逐场景。项目包含动态事件(交通堵塞、道路封锁、单向通行变化)的模拟,并提供可视化和日志记录功能。
Jupyter Notebook
5
0
1周前
这是一个RAG投毒安全实验项目,通过将恶意数据注入向量数据库来演示如何污染检索增强生成系统。包含Flask界面、FAISS向量存储和轻量级演示,帮助学习RAG架构、攻击面、投毒技术及防御策略。
Jupyter Notebook
5
0
1周前
urcuqui/rag-poisoning-lab cover
TorchCode是一个用于PyTorch算法实践的Jupyter Notebook项目,通过从零实现softmax、注意力机制和GPT-2等核心算法来强化面试技能,提供自动评分功能,可自托管或在线使用。
Jupyter Notebook
3,310
267
4天前
提供100多个针对各种大语言模型进行微调的Jupyter Notebook教程,涵盖数据处理、训练、评估和模型保存,主要支持Google Colab和Kaggle平台,帮助用户快速上手微调实践。
Jupyter Notebook
5,090
813
GNU Lesser General Public License v3.0
4天前
DEIMv2是基于DINOv3特征增强的实时目标检测框架,提供从超轻量到大型的多种模型尺寸,在COCO等基准测试中达到先进性能,适用于需要高效物体识别的场景。
Jupyter Notebook
1,585
171
Other
2周前
这个仓库是《AI Engineering》一书的配套资源库,为AI工程师提供学习材料,包括章节摘要、学习笔记、实用工具示例和案例研究,帮助开发者掌握基础模型的应用和工程实践。
Jupyter Notebook
14,282
2,067
2周前
chiphuyen/aie-book cover
该仓库使用AI技术检测图像中的成人内容并进行过滤,基于YOLO v11和HuggingFace预训练模型,提供图像识别与过滤脚本,可用于内容审核等场景。
Jupyter Notebook
12
1
GNU General Public License v3.0
1个月前
这是一个基于计算机视觉和深度学习的实时手语识别系统,使用OpenCV和TensorFlow/Keras框架。它能识别美式手语(ASL)手势并将手语转换为语音,帮助残障人士进行沟通。
Jupyter Notebook
138
101
MIT License
2周前
Doctra是一个Python文档解析库,能够解析、提取和分析PDF、DOCX等文档格式,支持表格提取、图表分析和OCR识别,提供Web界面和命令行工具
Jupyter Notebook
198
32
Apache License 2.0
2周前
AI-Scientist是一个用于实现全自动化开放科学发现的AI系统,它使基础模型(如大语言模型)能够自主进行科学研究、生成论文和提出新假设,无需人工监督,旨在实现真正的AI驱动的科研探索。
Jupyter Notebook
12,457
1,788
Other
2周前
SakanaAI/AI-Scientist cover
这是一个关于提示工程与提示攻击的综合课程仓库,主要记录关于提示工程技术和生成式AI开发技术的学习进展。内容包括ChatGPT越狱、GPT助手提示泄露、GPT提示注入、LLM安全防御技术、对抗性机器学习等主题,涵盖提示黑客攻防技术及LLM安全相关资源、论文和会议资料。
Jupyter Notebook
274
35
MIT License
2周前
AI工程学苑是一个专注于应用AI学习的开源教育资源库,提供从基础到进阶的结构化学习路径,包含提示工程、实际项目等内容,旨在通过实践项目帮助用户掌握生产环境中可用的AI工程技能。
Jupyter Notebook
2,143
248
MIT License
2周前
adithya-s-k/AI-Engineering.academy cover
Linly-Dubbing是一个智能视频多语言AI配音与翻译工具,可自动下载视频、分离人声、识别语音、翻译文本并生成多语言配音,实现视频的跨语言转换。
Jupyter Notebook
3,095
344
Apache License 2.0
2周前
Kedreamix/Linly-Dubbing cover

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-05 02:13
浙ICP备14020137号-1 $访客地图$