LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码,旨在提高公式处理的效率和便捷性。
该仓库提供了手写文字擦除和水印智能消除的高效解决方案,是相关比赛的获胜方案,基于深度学习技术处理图像。
PaddleSpeech是一个易用的语音工具包,支持自监督学习模型、最先进的ASR、流式TTS、说话者验证、端到端语音翻译和关键词识别等功能,旨在帮助开发者快速构建语音应用。
bert_seq2seq是一个基于PyTorch的轻量级框架,支持BERT进行多种NLP任务,包括自动摘要、情感分析等,且可方便地进行多GPU训练。
该项目使用BiLSTM+CRF实现邮寄地址的命名实体识别,涵盖省市区、收件人及联系电话等信息,适合需要处理地址数据的应用场景。
该仓库基于PyTorch实现了中文命名实体识别,使用BERT、BiLSTM和CRF相结合的方法,适用于处理和识别中文实体信息。
pyunit-ner是一个快速高效的NER实体识别模型,支持一键Docker部署,能够识别地址、人名和机构名。提供API接口,便于集成使用。
该仓库提供中文地址分词功能,通过序列标注识别和提取地址元素,支持模型训练和评估。
fastNLP是一个轻量级自然语言处理工具包,旨在简化用户的工程代码,支持多种深度学习框架,提供高效便捷的数据处理和训练功能。
pyresparser是一个简单的简历解析工具,能够从简历中提取姓名、邮箱、手机号码、技能等信息。