DART-GUI是一个用于图形用户界面(GUI)智能体的高效多轮强化学习框架。它通过解耦训练和自适应数据筛选技术,优化智能体在GUI环境(如桌面应用、网页)中的交互与自动化任务。仓库提供模型、训练代码、推理代码及Docker环境配置。
Python
74
4
Apache License 2.0
1天前
WebShop是一个模拟电子商务网站的研究环境,包含118万真实商品和1.2万条文本指令,用于开发和评估基于语言的智能体在网页交互中的能力。该仓库提供了复现论文结果的代码,适用于语言推理、搜索与决策等研究。
Python
501
99
MIT License
1天前
这是一个实时语音克隆工具,基于深度学习框架SV2TTS,通过5秒的语音样本即可克隆声音,并实时合成任意文本的语音。核心流程包括从短音频提取声音特征、根据文本合成语音特征、以及使用声码器生成最终音频。
Python
59,507
9,422
Other
20小时前
SeeAct是一个基于大型多模态模型(如GPT-4V)的通用网络智能体系统,能够自动在任意网站上执行任务。它包含稳健的代码库和运行支持组件,旨在实现自主网络操作。
Python
832
108
Other
1天前
OSU-NLP-Group/SeeAct cover
PyAutoGUI是一个跨平台的Python GUI自动化模块,可通过编程方式控制鼠标和键盘操作,用于自动化测试、屏幕录制和模拟用户交互等场景。
Python
12,334
1,403
BSD 3-Clause "New" or "Revised" License
22小时前
Youtu-GraphRAG是一个垂直统一的智能体框架,基于图模式整合Graph RAG技术,用于复杂推理任务。能显著降低token成本并提高准确性,支持跨领域知识迁移。
Python
1,074
160
Other
1天前
TencentCloudADP/youtu-graphrag cover
CoPaw是一个基于Python开发的个人AI助手项目,易于安装和部署,支持本地或云端运行。它兼容多种聊天应用,具有高度可扩展的插件能力,允许用户通过简单的配置与各类AI模型进行交互。
Python
10,004
1,131
Apache License 2.0
18小时前
agentscope-ai/CoPaw cover
这是一个Google Workspace的MCP服务器和CLI工具,允许用户通过AI助手和命令行,使用自然语言控制Gmail、日历、云端硬盘、文档、表格、幻灯片、聊天、表单、任务和搜索等谷歌服务。支持通过Claude等客户端进行一键安装,并包含远程OAuth2.1多用户认证。
Python
1,737
507
MIT License
19小时前
这是一个用于生成3D人体动作或3D角色动画的模型,名为HY-Motion 1.0。它基于流匹配技术,用户可以通过文本描述或指定姿态来控制动作生成。项目提供了推理代码、预训练模型以及在线演示。
Python
2,144
168
Other
1天前
CCXT是一个加密货币交易库,支持连接超过100家交易所,提供统一的API接口用于获取市场数据、执行交易操作,支持多种编程语言,适用于量化交易、策略回测和自动化交易程序的开发。
Python
41,257
8,538
MIT License
19小时前
oLLM是一个轻量级Python库,专为大上下文长度的LLM推理设计,基于Huggingface Transformers和PyTorch。它支持在消费级GPU(如8GB VRAM)上运行多种模型(如gpt-oss-20B、Llama-3.1-8B-Instruct),处理高达100k的上下文,无需量化,适用于离线工作负载。
Python
2,343
208
MIT License
1天前
Mega4alik/ollm cover
这是一个精选的高质量Claude代码技能库,提供生产就绪的技能模板和工具,用于增强开发工作流。包含PDF处理、画布设计等实用技能,每个技能都包含完整文档和元数据,便于集成到Claude技能系统中。
Python
52
7
MIT License
2天前
LEANN是一款在个人设备上运行的私有化RAG(检索增强生成)应用,主打存储效率(可节省97%存储空间)与隐私保护,提供快速、准确、无需联网的本地AI文档处理与问答功能。
Python
10,276
892
MIT License
18小时前
yichuan-w/LEANN cover
这是一个用于发音错误检测与诊断的端到端深度学习系统,支持文本相关的发音评估。采用CTC和注意力机制模型,并包含数据增强技术,使用TIMIT和L2-Arctic语音数据集进行训练。
Python
64
19
1周前
HTML PPT Designer是一个智能演示文稿设计工具,可将网页、音频、视频等内容自动转换为精美的HTML演示文稿,支持多种视觉风格、AI辅助设计、自动配图和视频导出功能。
Python
66
5
1天前

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-10 06:57
浙ICP备14020137号-1 $Map of visitor$