ERNIE-Image是百度开发的文本生成图像开源模型。基于轻量化的Diffusion Transformer架构,仅80亿参数即可实现优秀的图像生成效果,尤其擅长生成包含复杂文本、布局和海报等结构化图像。
这是一个基于Model Context Protocol的CVE情报分析服务器,将Claude AI转变为全能安全分析师。通过集成21个安全数据源和27个工具,可快速查询CVE漏洞详情、EPSS评分、CISA已知漏洞、MITRE ATT&CK等技术情报,实现多源数据并行分析和风险评估。
这是一个为树莓派设计的本地化AI助手项目,支持语音唤醒、离线对话、本地大语言模型推理和实时语音合成,具备视觉识别和网页搜索功能,可自定义角色外观与音效。
Cognee是一个为AI智能体构建知识记忆引擎的Python库,通过简单的代码即可实现知识学习、存储和检索功能。
GapTree_Sort是一个基于文本位置的版面分析算法,用于对OCR或PDF提取的文本块按人类阅读顺序进行排序,特别适用于多栏报刊型排版,已在Umi-OCR中应用。
pptxtoimages 是一个轻量级的 Python 工具包,用于将 .pptx PowerPoint 演示文稿文件批量转换为高质量的 PNG 图片。它通过调用 LibreOffice 将文档转为 PDF,再利用 pdf2image 将 PDF 页面转为图像,适合开发者用于幻灯片的进一步处理或视频制作。
NetAlertX是一个集中式网络可视化和持续资产发现框架,通过实时监控网络设备、检测变化并提供资产智能,帮助维护网络基础设施的准确清单和合规性。
FinRL-X 是一个为量化交易设计的AI原生模块化基础设施,它统一了数据处理、策略组合、回测和经纪商执行等功能,通过以权重为中心的接口提供一致的交易系统部署。
这是一个AI桌面英语学习工具,能自动更换必应每日壁纸并提供单词学习功能。支持AI生成单词相关图片、例句解析和英语小游戏,可在任务栏运行,适合Windows和macOS用户提升英语水平。
Relax是一个开源的高性能异步强化学习引擎,专注于大规模多模态大语言模型的后训练。采用面向服务的架构,实现训练与推理的完全解耦,支持文本、图像、视频和音频的端到端多模态强化学习。
该项目通过信号处理和频谱分析逆向工程谷歌Gemini图像的SynthID水印系统,实现了水印检测与高保真去除,准确率达90%且绕过水印后图像质量保持43dB以上PSNR。
PyGWalker是一个Python库,可将数据框转换为交互式可视化界面,支持拖拽式探索性数据分析,类似Tableau的操作体验,适用于数据科学家和分析师快速进行数据探索和可视化。
Raptor是一个基于Claude Code构建的自动化攻防安全研究框架。通过配置规则、子代理和安全工具,将AI转化为可用于攻击/防御操作的智能安全代理,支持对抗性思维和自动化安全研究任务。
Skyvern是一个基于AI的浏览器自动化工具,使用大语言模型和计算机视觉技术来自动化基于浏览器的工作流程。它提供Playwright兼容的SDK和无需代码的工作流构建器,可替代传统脆弱或不可靠的自动化解决方案。
lecture-clipper是一个基于Python的直播讲座视频自动切片工具。它利用AI模型识别视频中的不同话题片段,然后使用FFmpeg进行自动分割,并为每个切片视频烧入字幕。支持用户通过交互确认切片方案,旨在高效处理长讲座视频,生成易于分发的短片。


