Vimo是一款革命性的桌面应用程序,利用先进的AI技术让用户与视频进行智能对话,能够处理任意长度的视频内容并准确回答问题。
DiffSplat是一个生成框架,可以从文本提示和单视图图像中合成3D高斯点,速度为1~2秒,适用于图像扩散模型的重用。
maestro 是一款用于加速多模态模型微调的工具,简化配置、数据加载和训练流程,支持常用视觉语言模型如Florence-2、PaliGemma 2和Qwen2.5-VL。
VisoMaster是一个功能强大的视频换脸和编辑软件,利用AI技术轻松实现自然的效果,适合日常用户和专业人士。
Kiln是一个用于微调LLM模型、生成合成数据及数据集协作的工具,旨在加速AI原型开发。
此仓库提供针对大语言模型的微调和强化学习工具,支持多种模型以提高训练速度和降低内存使用,适合初学者使用。
GPT Researcher是一个基于大型语言模型的自动化研究工具,能够在本地和网络上进行深入研究,并生成包含引用的详细报告。
Pyphen是一个纯Python模块,用于利用现有的Hunspell分词字典进行文本的断词处理,简化了文本排版。
Sonic是一个全球音频感知的肖像动画实现,旨在提升肖像动画中的音频体验,适用于研究和开发。
Open Deep Research是一个开放源代码的深度研究代理,支持多种模型提供商和搜索工具,性能优异,适合开发者构建深度学习应用。