知鸦日报2025-07-25

2025-07-24 16:30:00 ~ 2025-07-25 16:30:00

Technologie

哔哩哔哩技术:B站大数据平台元数据血缘建设与应用

摘要

大数据血缘建设助力数据治理,通过统一元数据血缘平台,理清数据加工链路,提升数据质量和安全。血缘模型涵盖表级、字段级和算子级,支持数据流转全链路可视化。架构演进实现血缘采集自运维,确保数据完整性和时效性。应用场景包括找数用数、影响评估、数据质量检查和敏感字段监控,推动数据治理效率提升。

登录后可查看文章图片

独家专访:手把手教你如何“炼”出风格统一的AI绝美藏风游戏

摘要

《伏藏行者·启明录》是一款融合藏传佛教文化与AI技术的独立游戏,由设计专业毕业生蹦萨奇主导完成。游戏以藏地文化为背景,玩家通过寻找伏藏,体验一场关于慈悲与智慧的冒险。美术风格结合唐卡与工笔画的东方美学,AI生成画面经过反复调试,确保风格统一。游戏不仅是一次艺术实验,更是对藏文化的深度诠释与传播。

登录后可查看文章图片

meta技术:Policy Zones: How Meta enforces purpose limitation at scale in batch processing systems

摘要

Meta开发了隐私感知基础设施(PAI)和策略区域(Policy Zones),用于大规模批处理系统中数据用途的限制。通过运行时执行和SQL解析,策略区域在每日数百万数据流中传播和执行隐私注释,每小时进行数万亿次用户同意检查,并处理每小时数百PB的数据流。该系统帮助工程师快速响应隐私需求,确保数据处理的合规性,同时减少隐私合规带来的摩擦。

登录后可查看文章图片

grab技术:The evolution of Grab

摘要

Grab采用Amazon Aurora Postgres构建新一代ML特征存储,解决高基数、高维数据管理等挑战。通过特征表设计,实现原子性更新、读写隔离及上下文检索,提升模型性能。数据摄取框架确保版本兼容性与原子性,Aurora的分布式存储架构则优化了读写分离与成本效益。去中心化部署进一步提升了系统可用性与缓存效率。

登录后可查看文章图片

阿里巴巴技术:好奇心之旅:Cursor代码库索引机制的学习笔记

摘要

探索Cursor的codebase索引机制,从Merkle Tree到turbopuffer向量数据库,再到开源的Continue实现,揭示AI编程工具背后的技术奥秘。Merkle Tree用于高效变更检测,turbopuffer提供云端向量存储与检索,Continue则通过标签系统和本地数据库实现索引更新。这些技术共同提升了AI编程工具的智能化和效率。

登录后可查看文章图片

滴滴技术:滴滴因果建模新突破:最优传输+表征学习攻克长期效应估计难题​

摘要

本文探讨了在网约车市场中,如何通过数据融合估计长期异质性剂量-响应曲线(Long-term HDRC)的问题。针对连续处理变量和未观测混淆变量的挑战,提出了一种基于最优传输的加权方案,并通过平衡表征学习消除可观测混淆偏差。模型LEARN结合了OT加权模块、平衡表征模块和长期估计模块,有效提升了长期处理效应的估计精度,实验验证了其在真实场景中的显著效果。

登录后可查看文章图片

小红书技术:小红书JDK升级带来10%整体性能提升,这份升级指南收好了!

摘要

小红书成功将Java服务从JDK8升级至JDK11/17,性能提升10%,GC开销降低50%,稳定性显著增强。通过优化G1GC算法、修复JVM Bug及引入ZGC等新特性,解决了FullGC卡顿、内存泄漏等问题。采用Jemalloc替代Pmalloc,有效控制内存碎片。标准化升级流程确保平稳过渡,为后续JDK21虚拟线程等特性铺路。

登录后可查看文章图片

腾讯技术:任务紧急,CodeBuddy是如何成为“第二双手”的?

摘要

CodeBuddy AI IDE助力前端开发,通过AI生成界面代码、API定义和业务逻辑,大幅提升效率。项目从原型到可用界面,结合文字描述优化生成精度,借助MCP协议自动生成API调用代码,实现高效联调。未来计划提升UI生成精度,整合Figma,打通设计到开发的完整流程,让AI成为开发中的高效传送带。

登录后可查看文章图片

阿里巴巴技术:AI 基础知识从 0.3 到 0.4——如何选对深度学习模型?

摘要

小编带你了解AI模型架构与预训练模型的应用。从CNN、RNN到Transformer,不同架构适用于各种任务。预训练模型如BERT、GPT系列,通过微调快速适配特定需求,提升效率。Hugging Face等平台提供丰富资源,助你轻松上手AI开发。掌握这些核心概念,AI之旅更顺畅!

登录后可查看文章图片

阿里巴巴技术:APIG x OKG:游戏连接治理的「最后一公里」

摘要

游戏连接治理面临七层网络挑战,OKG与APIG联手打造新一代游戏网关,实现优雅下线和无感变更。通过状态感知和流量管理,保障玩家会话连续性,优化云原生游戏体验。解决方案零改造接入,提供全维度可观测性,简化API治理,助力游戏服务快速迭代与高效运维。

登录后可查看文章图片

混合推理机制是如何实现的?

摘要

【AI混合推理新突破】Qwen3通过四阶段训练实现快慢思考切换:冷启动打基础,强化学习提深度,思维融合控模式,通用学习稳表现。用/think和/no_think标签手动调控,或enable_thinking参数自动切换,让AI在简单题秒答、难题深琢磨。虽当前效果未达预期,但为自适应推理模型铺路,未来可期!

登录后可查看文章图片

Méthodes

对话资深财经媒体人:从案头工作到采写现场,产经报道如何定位问题关键点?

摘要

新手财经记者可通过拆解产业链、分析招股书和财报快速构建行业认知。采访中需关注现场细节,调动感官记录环境,增强报道现场感。撰写公司报道时,可从数据异常、行业格局变动中寻找新闻点,保持客观分析同时融入独到见解。危机报道需谨慎处理,确保事实准确,保护受访者隐私。

登录后可查看文章图片

Divulgation

有肥牛卷肥羊卷,为什么没有肥猪卷

摘要

吃火锅时常见肥牛卷、肥羊卷,却少见肥猪卷。猪肉肌纤维松散,薄切易散,脂肪分布不均,涮煮难熟透,存在旋毛虫风险。牛肉肌纤维紧密,结缔组织丰富,保水性强,适合薄切涮煮。重组肉卷则多用猪肉、鸭肉等低价肉制成,贴上“肥牛卷”标签出售。猪肉在原切肉卷领域劣势明显,但在重组肉卷中却以性价比取胜。

登录后可查看文章图片


‹ 2025-07-24 日报 2025-07-26 日报 ›

qrcode

关注公众号
接收推送