类库 › semhash
MinishLab

MinishLab/semhash

SemHash是一个轻量级多模态库,专门用于语义去重、异常值过滤和代表性样本选择。该库支持文本(使用快速Model2Vec嵌入)、图像、音频等多种数据模态,能处理单数据集清理和跨数据集去重任务,并集成高效相似性搜索工具以提高性能。

MinishLab/semhash

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-02 09:42
浙ICP备14020137号-1 $访客地图$