Scenema Audio是一个零样本情感语音克隆与生成工具,支持从10秒参考音频克隆声音。它基于扩散Transformer模型,能根据文本提示生成具有真实情感、节奏和呼吸控制的语音,适用于电影配音和有声书等场景。
Python
457
69
MIT License
11小时前
ScenemaAI/scenema-audio cover
这是一个全面的机器学习与AI面试准备资源库,涵盖ML编码、系统架构设计、LLM/GenAI、RAG系统及算法实现。提供从基础理论到生产级代码的实战指南,帮助求职者掌握2026年前沿标准,适用于AI工程师岗位的技术面试复习与技能提升。
Python
367
53
15小时前
OmniPart是SIGGRAPH Asia 2025提出的3D生成模型,通过语义解耦和结构凝聚实现部件感知。支持交互式演示、命令行推理及训练,需预先生成输入图像的分割掩码。提供预训练模型、代码及数据处理工具,旨在提升3D生成的质量与可控性。
Python
221
20
MIT License
23小时前
HKU-MMLab/OmniPart cover
Pentest Agent Suite是面向Claude Code等7款AI编程工具的自主漏洞赏金框架。提供50个代理、26条命令及19个CLI工具,支持自动化狩猎循环、利用链构建及多平台集成(如HackerOne),旨在通过AI辅助提升渗透测试效率与安全性。
Python
497
94
12小时前
3D-Fixer是基于单张图像生成高保真3D场景的开源项目。它采用粗到细的就地补全范式,利用碎片几何作为空间锚点,无需逐场景优化即可快速生成完整3D资产,具有高质量和高泛化性。
Python
70
2
Apache License 2.0
1天前
HorizonRobotics/3D-Fixer cover
基于Whisper AI的多后端转录应用,支持本地文件或URL输入。具备极速性能、Mac-arm优化及完全隐私免费特性。自动生成speaker.json实现说话人分离,提供简易安装体验,适用于Windows和Mac平台。
Python
1,310
130
MIT License
23小时前
SDAR是自我蒸馏智能体强化学习方法的官方代码,旨在提升ALFWorld、WebShop等环境中的RL性能。该仓库提供完整的安装指南与实验脚本,适用于研究人员复现论文结果及进行相关算法开发。
Python
105
6
Apache License 2.0
10小时前
面向商业分析师的AI数据分析智能体,支持自然语言交互。用户上传Excel/CSV或连接数据库后,系统自动执行SQL查询、生成图表并提供业务洞察,旨在让非技术人员通过对话完成复杂数据分析。
Python
1,185
88
Apache License 2.0
18小时前
Zafer-Liu/Data-Analysis-Agent cover
DreamLite是一个轻量级端侧统一模型,支持文生图与图像编辑。它采用0.39B参数,在iPhone等设备上实现4步推理、约3秒生成1024x1024图片,完全离线运行,无需云端依赖。
Python
583
38
Apache License 2.0
21小时前
buddyMe是Python实现的轻量级AI智能体框架,支持多模型热切换、分层人格、三级技能加载及心跳记忆系统。具备复杂任务自动拆解执行、内置工具与25+预置技能、持久记忆及定时调度能力,适用于编程助手或通用任务代理开发。
Python
296
17
13小时前
MM-Agent是一个基于大语言模型的智能体系统,专为解决现实世界数学建模问题而设计。它利用LLM作为智能体,实现自动化问题解决、智能代码生成及数据处理,旨在提升数学建模的效率与准确性,适用于学术研究及实际应用场景。
Python
548
37
GNU General Public License v3.0
23小时前
usail-hkust/LLM-MM-Agent cover
这是一个关于Claude Code的全面实战指南,涵盖安装、提示工程、技能、钩子、MCP及多智能体自动化。通过清晰的心智模型和真实案例,帮助开发者从入门到精通,掌握高效工作流与团队协作策略。
Python
1,867
215
MIT License
13小时前
wesammustafa/Claude-Code-Everything-You-Need-to-Know cover
ShadowBroker是一个开源的全球情报聚合平台,整合60+实时公开数据源(如航班、卫星、地震等),提供统一的暗操作地图界面。支持35+数据层切换及多种视觉模式,旨在帮助分析师和研究者通过单一界面可视化全球公共信号与地缘政治事件。
Python
8,270
1,247
GNU Affero General Public License v3.0
10小时前
基于开源LLM和E2B桌面沙箱的AI自动化计算机操作工具。通过键盘、鼠标和Shell控制云端Linux环境,支持多模型集成与实时屏幕流式传输,允许用户随时暂停并干预,实现安全的AI驱动计算机使用。
Python
2,024
235
Apache License 2.0
13小时前
Graph-R1是一个基于端到端强化学习的Agentic GraphRAG框架,旨在提升大语言模型的图推理能力。通过构建知识超图和迭代推理循环,有效结合结构化知识与LLM,适用于医疗、金融等知识密集型领域的复杂问答任务。
Python
522
68
MIT License
17小时前
LHRLAB/Graph-R1 cover

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-20 11:59
浙ICP备14020137号-1 $访客地图$