EasyNLP是一个易用的自然语言处理工具包,支持分布式训练与多种算法,旨在简化NLP开发与应用。
CTRNet是一个用于文本去除的背景恢复算法实现,通过建模局部和全局上下文,实现精确的背景重建。
ControlNet是一个神经网络结构,通过添加额外条件来控制扩散模型,方便在小规模数据集上进行训练而不破坏原有模型。
SimBERT是一个基于UniLM思想的BERT模型,结合了检索与生成任务,旨在提高相似句子的生成与理解能力。
LaTeX-OCR项目利用ViT模型将数学公式图像转换为LaTeX代码,旨在提高公式处理的效率和便捷性。
该仓库提供了手写文字擦除和水印智能消除的高效解决方案,是相关比赛的获胜方案,基于深度学习技术处理图像。
PaddleSpeech是一个易用的语音工具包,支持自监督学习模型、最先进的ASR、流式TTS、说话者验证、端到端语音翻译和关键词识别等功能,旨在帮助开发者快速构建语音应用。
bert_seq2seq是一个基于PyTorch的轻量级框架,支持BERT进行多种NLP任务,包括自动摘要、情感分析等,且可方便地进行多GPU训练。
该项目使用BiLSTM+CRF实现邮寄地址的命名实体识别,涵盖省市区、收件人及联系电话等信息,适合需要处理地址数据的应用场景。
该仓库基于PyTorch实现了中文命名实体识别,使用BERT、BiLSTM和CRF相结合的方法,适用于处理和识别中文实体信息。


