这是一个基于阿里通义千问Qwen3-TTS的ComfyUI自定义节点插件,提供高质量的语音合成、零样本语音克隆和语音设计功能,支持多语言和高效推理,适用于音频生成和定制。
Python
1,201
119
1天前
flybirdxx/ComfyUI-Qwen-TTS cover
Surfkit是一个用于构建和分享在设备上运行的AI代理工具包。支持创建多模态代理、社区共享、本地/云端部署、任务规模化管理和行为追踪,可通过Python库或CLI快速使用。
Python
191
18
MIT License
2天前
Meta官方开源的声音分割基础模型,可通过文本、视觉或时间提示从复杂音频中分离特定声音。提供推理代码、预训练模型下载和示例notebook。
Python
3,346
289
Other
21小时前
facebookresearch/sam-audio cover
一个用于收集和分析预测市场数据的Python框架,提供Polymarket和Kalshi等平台的公开数据集。包含数据采集、存储及生成统计图表和分析报告的工具,适合研究和量化分析。
Python
2,125
279
MIT License
23小时前
MacOS Agent 是一款macOS自动化代理工具,允许用户通过自然语言文本命令控制多个系统应用程序和服务,包括Finder、TextEdit、Preview、日历、Excel等,实现任务自动化。
Python
55
2
2天前
Computer-use-agents/MacOS-Agent cover
Mobile-use是一个开源AI代理工具,允许用户通过自然语言指令自动化控制Android或iOS设备,模拟人类操作手机应用界面,实现如发送消息、应用导航等任务。
Python
2,281
188
Apache License 2.0
23小时前
minitap-ai/mobile-use cover
DART-GUI是一个用于图形用户界面(GUI)智能体的高效多轮强化学习框架。它通过解耦训练和自适应数据筛选技术,优化智能体在GUI环境(如桌面应用、网页)中的交互与自动化任务。仓库提供模型、训练代码、推理代码及Docker环境配置。
Python
71
4
Apache License 2.0
1天前
WebShop是一个模拟电子商务网站的研究环境,包含118万真实商品和1.2万条文本指令,用于开发和评估基于语言的智能体在网页交互中的能力。该仓库提供了复现论文结果的代码,适用于语言推理、搜索与决策等研究。
Python
496
99
MIT License
2天前
这是一个实时语音克隆工具,基于深度学习框架SV2TTS,通过5秒的语音样本即可克隆声音,并实时合成任意文本的语音。核心流程包括从短音频提取声音特征、根据文本合成语音特征、以及使用声码器生成最终音频。
Python
59,497
9,422
Other
23小时前
SeeAct是一个基于大型多模态模型(如GPT-4V)的通用网络智能体系统,能够自动在任意网站上执行任务。它包含稳健的代码库和运行支持组件,旨在实现自主网络操作。
Python
830
108
Other
3天前
OSU-NLP-Group/SeeAct cover
PyAutoGUI是一个跨平台的Python GUI自动化模块,可通过编程方式控制鼠标和键盘操作,用于自动化测试、屏幕录制和模拟用户交互等场景。
Python
12,325
1,403
BSD 3-Clause "New" or "Revised" License
21小时前
Youtu-GraphRAG是一个垂直统一的智能体框架,基于图模式整合Graph RAG技术,用于复杂推理任务。能显著降低token成本并提高准确性,支持跨领域知识迁移。
Python
1,070
159
Other
2天前
TencentCloudADP/youtu-graphrag cover
CoPaw是一个基于Python开发的个人AI助手项目,易于安装和部署,支持本地或云端运行。它兼容多种聊天应用,具有高度可扩展的插件能力,允许用户通过简单的配置与各类AI模型进行交互。
Python
8,431
899
Apache License 2.0
20小时前
agentscope-ai/CoPaw cover
这是一个Google Workspace的MCP服务器和CLI工具,允许用户通过AI助手和命令行,使用自然语言控制Gmail、日历、云端硬盘、文档、表格、幻灯片、聊天、表单、任务和搜索等谷歌服务。支持通过Claude等客户端进行一键安装,并包含远程OAuth2.1多用户认证。
Python
1,684
498
MIT License
21小时前
这是一个用于生成3D人体动作或3D角色动画的模型,名为HY-Motion 1.0。它基于流匹配技术,用户可以通过文本描述或指定姿态来控制动作生成。项目提供了推理代码、预训练模型以及在线演示。
Python
2,129
167
Other
21小时前

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-06 09:28
浙ICP备14020137号-1 $Гость$