知鸦日报2026-05-04

2026-05-03 16:30:00 ~ 2026-05-04 16:30:00

Công nghệ

跟Claude官方技能学Harness

摘要

Harness 是一套让 AI 标准化工作的作业规范，核心是拆解任务、最小化上下文、一步一验、持续复盘。Claude 官方的 Skill Creator 2.0 将创建 Skill 的过程封装成一个完整 Harness，强调测试、对照组和人类反馈。通过原子化步骤、自包含工作空间和渐进式披露，Harness 确保 AI 在复杂任务中产出稳定、可检查的结果，而非依赖运气。

登录后可查看文章图片

uber技术：Validating Bounding Box Annotations

摘要

Uber开发了一套基于机器学习的视频边界框标注验证系统，用于自动检测标注错误。该系统通过分析视觉、运动和坐标特征，结合XGBoost分类器，实时识别ID交换和位置跳跃等常见错误。面对不同场景的复杂性，如物体大小、运动速度和相机抖动等挑战，系统采用滑动窗口和聚类技术提升准确性。目前已在内部工具uLabel中部署，显著提高了数据质量，未来将支持更多错误类型检测。

登录后可查看文章图片

uber技术：Hybrid Core Allocation: From Overallocation to Reliable Sharing

摘要

Uber的Odin平台引入混合CPU分配模型，结合专用核心和共享核心，优化突发性工作负载的性能。通过Linux的cpuset和cpu.shares，系统动态分配CPU资源，提升主机级效率。NUMA感知的内存亲和性策略进一步优化了多核系统性能，减少了延迟。这种混合模型降低了过度配置，提高了CPU利用率，确保了服务级别的性能保证。

登录后可查看文章图片

uber技术：Accelerating Search and Ingestion with High-Performance gRPC™ in OpenSearch™

摘要

Uber在OpenSearch中引入原生gRPC支持，解决了REST/JSON在高流量、大数据量下的性能瓶颈。通过gRPC与Protobuf结合，显著提升了搜索和批量写入的延迟与吞吐量，特别是在向量搜索和大数据场景下表现突出。此举不仅简化了系统集成，还为高吞吐量任务提供了更高效的传输方式，推动了OpenSearch生态的进一步发展。

登录后可查看文章图片

uber技术：Accelerating Deep Learning: How Uber Optimized Petastorm for High-Throughput and Reproducible GPU Training

摘要

Uber通过优化Petastorm数据加载器，解决了大规模深度学习模型训练中的GPU利用率低和训练不可复现的问题。通过本地磁盘缓存和并行化数据转换，GPU利用率从10-15%提升至60%以上，训练时间从22小时缩短至3小时，计算成本降低80%。同时，消除数据加载中的随机性，确保训练结果的复现性。这些优化显著提升了训练效率和模型迭代速度。

登录后可查看文章图片

‹ 2026-05-03 日报 2026-05-05 日报 ›