这个仓库是一个快速、强类型的Google航班抓取器(API),使用Python实现,允许用户获取航班信息和价格。
该仓库是一本关于使用PyTorch和Hugging Face微调大型语言模型的实用指南,提供Jupyter Notebook示例和Google Colab支持。
这个仓库提供了一个简单的Agentic RAG系统,利用LangGraph实现对话记忆和查询澄清,适合快速学习检索增强生成代理的构建方法。
BioReason是一个结合DNA基础模型与大型语言模型的创新架构,旨在促进多模态生物推理,助力基因组数据分析和科学发现。
该仓库提供了GitHub Copilot在数据科学中的应用工作流和模式,旨在帮助开发者熟悉如何使用Python和Jupyter Notebook进行数据分析和报告生成。
The Well是一个大型物理模拟数据集集合,提供15TB的多种时空物理系统数值模拟数据,支持机器学习与计算科学研究。
WhisperS2T是一个为Whisper模型优化的语音转文本管道,支持多种推理引擎,速度比其他实现快2.3倍,提供更高的转录准确性。
Sionna是一个开源的Python库,专注于通信系统的研究,包括无线和光通信的链接级模拟以及基于物理层抽象的系统级模拟。
此仓库提供使用AG2构建的智能代理应用示例,展示AI代理在电商、金融分析等领域的实用实现,助力用户参与AI生态系统。
Surya是一个针对日光物理的基础模型,利用多种工具的数据进行训练,支持太阳耀斑预测、活动区域分割等任务。
PII Masker是一个开源工具,利用DeBERTa-v3自动检测和掩盖个人敏感信息(PII),确保数据隐私合规,适用于数据敏感型工作流程。
GraphGen4Code是一个创建代码知识图谱的工具包,基于WALA代码分析,帮助实现程序搜索、代码理解和自动化等应用。
LLM Speedrunner是一个自动化基准测试工具,旨在评估大型语言模型(LLM)在重现和发现语言建模创新方面的能力。
Shapash是一个Python库,旨在使机器学习模型的解释和可理解性更易于使用,提供清晰的可视化与Web应用,方便数据科学家与非专业人士共享结果。
InkSight 是一个离线到在线的手写转换工具,通过教学视觉-语言模型来实现阅读和书写功能,旨在提升手写识别的实用性和准确性。


