doccano是一个开源文本标注工具,主要用于机器学习中的数据标注,支持文本分类、序列标注等任务,帮助用户快速构建标注数据集。
g2pW是一个中文汉字转音素的转换器,能够将汉字转换为注音或拼音,支持多音字消歧,是语音处理和自然语言处理的有效工具。
DocQuery 是一个文档查询工具,利用大语言模型轻松提取半结构化和非结构化文档(如PDF和扫描图像)中的信息。
PiPiName是一个以三才五格和古诗文为基础,为宝宝生成名字的Python工具,支持个性化配置。
invisible-watermark是一个Python库,用于在图像上创建不可见水印,适用于数字图像保护。此库仍处于实验阶段,不支持GPU加速。
fontTools是一个用于处理字体文件的Python库,支持TrueType、OpenType等格式的转换与操作,方便开发者使用。
monoback是一个用于生成与您喜欢的等宽字体对齐的CJK字体备选方案的工具,便于在编程环境中使用。
Umi-OCR是一个免费的开源离线OCR软件,支持截图、批量图片和PDF文档识别,具有多语言识别能力,使用方便高效。
TTS是一个高级文本转语音生成库,支持多达1100种语言,提供预训练模型和模型训练、微调工具,适用于研究和生产环境。
WeTextProcessing是一个文本处理工具包,主要用于文本规范化和逆文本规范化,支持中英文处理。