2026-05-03 16:30:00 ~ 2026-05-04 16:30:00
Harness 是一套让 AI 标准化工作的作业规范,核心是拆解任务、最小化上下文、一步一验、持续复盘。Claude 官方的 Skill Creator 2.0 将创建 Skill 的过程封装成一个完整 Harness,强调测试、对照组和人类反馈。通过原子化步骤、自包含工作空间和渐进式披露,Harness 确保 AI 在复杂任务中产出稳定、可检查的结果,而非依赖运气。
登录后可查看文章图片
Uber开发了一套基于机器学习的视频边界框标注验证系统,用于自动检测标注错误。该系统通过分析视觉、运动和坐标特征,结合XGBoost分类器,实时识别ID交换和位置跳跃等常见错误。面对不同场景的复杂性,如物体大小、运动速度和相机抖动等挑战,系统采用滑动窗口和聚类技术提升准确性。目前已在内部工具uLabel中部署,显著提高了数据质量,未来将支持更多错误类型检测。
登录后可查看文章图片
Uber的Odin平台引入混合CPU分配模型,结合专用核心和共享核心,优化突发性工作负载的性能。通过Linux的cpuset和cpu.shares,系统动态分配CPU资源,提升主机级效率。NUMA感知的内存亲和性策略进一步优化了多核系统性能,减少了延迟。这种混合模型降低了过度配置,提高了CPU利用率,确保了服务级别的性能保证。
登录后可查看文章图片
Uber在OpenSearch中引入原生gRPC支持,解决了REST/JSON在高流量、大数据量下的性能瓶颈。通过gRPC与Protobuf结合,显著提升了搜索和批量写入的延迟与吞吐量,特别是在向量搜索和大数据场景下表现突出。此举不仅简化了系统集成,还为高吞吐量任务提供了更高效的传输方式,推动了OpenSearch生态的进一步发展。
登录后可查看文章图片
Uber通过优化Petastorm数据加载器,解决了大规模深度学习模型训练中的GPU利用率低和训练不可复现的问题。通过本地磁盘缓存和并行化数据转换,GPU利用率从10-15%提升至60%以上,训练时间从22小时缩短至3小时,计算成本降低80%。同时,消除数据加载中的随机性,确保训练结果的复现性。这些优化显著提升了训练效率和模型迭代速度。
登录后可查看文章图片
关注公众号
接收推送