知鸦日报2025-01-14

2025-01-13 16:30:00 ~ 2025-01-14 16:30:00

Технологии

pinterest技术:How Optimizing Memory Management with LMDB Boosted Performance on Our API Service

摘要

NGAPI, the API platform for serving all first party client API requests, requires optimized system performance to ensure a high success rate of requests and allow for maximum efficiency to provide Pinners worldwide with engaging content. Recently, our team made a significant improvement in handling memory pressure to our API service by implementing a Lightning Memory-Mapped Database (LMDB) to streamline memory management and enhance the overall efficiency of our fleet of hosts. To handle parallelism, NGAPI relies on a multi-process architecture with gevent for per-process concurrency. However, at Pinterest scale, this can cause an increase in memory pressure, leading to efficiency bottlenecks. Moving to LMDB reduced our memory usage by 4.5%, an increase of 4.5 GB per host, which allowed us to increase the number of processes running on each host from 64 to 66, resulting in a greater number of requests each host could handle and better CPU utilization, thus reducing our overall fleet size. [1] The result? More happy Pinners, per host!

How Optimizing Memory Management with LMDB Boosted Performance on Our API Service

腾讯技术:篡改微信余额技术可刑性研讨 2.0

摘要

在《论篡改微信余额的技术可刑性》一文中,鹅厂资深资金架构师分享论证了技术上的可刑性,评论区的卧龙凤雏们也纷纷提出了自己天才般的设想,场面非常热闹。

正所谓“未知攻,焉知防”,腾讯云开发者公众号特意约稿原作者,针对大家关注的技术方案做了进一步拆解研讨,看完你的余额就有救了,下半辈子就有“铁”饭碗了!

篡改微信余额技术可刑性研讨 2.0

阿里巴巴技术:“日志=数据库”?聊一聊日志背后的抽象

摘要

本文从思考日志的本质开始,一览业界对日志使用的最佳实践,然后尝试给出分布式存储场景下对日志模块的需求抽象,最后是技术探索路上个人的一点点感悟。

“日志=数据库”?聊一聊日志背后的抽象

4种方法+1个工具,轻松用LLMs构建知识图谱!

摘要

大型语言模型(LLMs)的兴起彻底改变了我们从文本中提取信息和与之交互的方式。然而,尽管它们的能力令人印象深刻,LLMs在推理、一致性以及信息的上下文准确性等方面仍然面临一些固有的挑战。这些问题源于LLMs的概率性本质,可能导致幻觉(hallucinations)、缺乏透明性以及处理结构化数据的困难。

这正是知识图谱(Knowledge Graphs, KGs)发挥作用的地方。通过将LLMs与知识图谱相结合,可以显著增强AI生成的知识。为什么呢?知识图谱提供了信息的结构化和互联表示,反映了现实世界中实体及其关系。与传统数据库不同,知识图谱能够捕获并推理人类知识的复杂性,确保LLMs的输出来自结构化、可验证的知识库。这种整合可以带来更准确、一致且上下文相关的结果。

像医疗、金融和法律服务等行业由于对精确和可解释性信息的需求,可以从知识图谱中获得巨大益处。

4种方法+1个工具,轻松用LLMs构建知识图谱!

京东技术:京东广告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速实践

摘要

推荐系统的主要任务是根据用户的历史行为预测其兴趣点,并向其推荐相应的商品。传统的推荐系统在处理用户请求时,会触发多个召回模块(包括热门商品召回、个性化召回、深度召回等),以召回大量候选商品。

京东广告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速实践

巧用RAG解锁GEE代码自动生成,遥感开发的AI新工具

摘要

生成更准确的GEE代码,空间分析不求人。

巧用RAG解锁GEE代码自动生成,遥感开发的AI新工具

得物技术:Triton-Lang在Transformer优化加速中的实践

摘要

Triton是OpenAI 推出的以python为编程语言基础,专门为深度学习研发和高性能计算而设计的编程语言和编译器,旨在简化和优化GPU编程的复杂操作,降低高性能优化的门槛。

Triton-Lang在Transformer优化加速中的实践

Методы

AI+招聘:HR必须掌握的高质量提示词技巧

摘要

提示词越好,输出效果越惊艳。

AI+招聘:HR必须掌握的高质量提示词技巧

‹ 2025-01-13 日报 2025-01-15 日报 ›

qrcode

关注公众号
接收推送