知鸦日报2025-03-19

2025-03-18 16:30:00 ~ 2025-03-19 16:30:00

テクノロジー

阿里巴巴技术:揭开RAG的神秘面纱:重新定义信息检索的革命性技术

摘要

检索增强生成(RAG)结合了检索与生成技术,通过向量数据库高效检索知识,并结合大模型生成合理答案。RAG解决了大模型知识局限、幻觉和数据安全等问题,关键技术包括文本清洗、切块、向量嵌入和提示词工程。优化召回效果、结合元数据和多检索器融合可提升系统性能,评估方法包括命中率和LLM评估法。

登录后可查看文章图片

A Visual Guide to LLM Agents

摘要

LLM Agents通过增强记忆、工具和规划能力,弥补了传统LLM的不足。记忆分为短期和长期,工具扩展了LLM的功能,规划则通过推理和行动循环实现任务分解。多Agent系统通过分工协作,进一步提升了复杂任务的执行效率。ReAct和Reflexion等框架结合了推理与行动,使LLM能够自主调整策略。这些技术推动LLM向更智能、更自主的方向发展。

信也技术:信贷流程配置平台

摘要

公司全球布局加速,技术团队面临多国市场复杂信贷流程和高频APP迭代挑战。旧模式Hard Code效率低、资源消耗重、系统风险高。新采用All In Config模式,构建信贷流程配置平台,通过流程引擎和渲染引擎实现可视化配置,提升效率、降低风险。已完成多国业务落地,接口标准化率达87.5%,迭代周期压缩至1/7,未来目标实现90%+业务变更通过配置化完成。

登录后可查看文章图片

阿里巴巴技术:大模型推理框架RTP-LLM Embedding技术揭秘

摘要

阿里巴巴智能引擎团队基于自研的RTP-LLM大模型推理引擎,优化了Embedding框架,解决了Transformer模型在计算Embedding时的性能瓶颈。通过高性能算子、请求调度策略优化及模型量化技术,显著提升了计算效率和吞吐量,成功应用于淘宝主搜等场景,并在双十一期间表现优异。未来将继续优化HTTP服务性能和调度策略,进一步提升框架表现。

登录后可查看文章图片

Uncensor any LLM with abliteration

摘要

理论上可行,但实际上取决于TransformerLens库是否支持DeepSeek。此外,实现这一目标还需要消耗大量的显存资源。

阿里巴巴技术:如何解决隐式内存占用难题?

摘要

在云原生和容器化环境中,内存管理面临隐式内存占用、filecache高、SReclaimable高、cgroup残留和内存去向不明等挑战。阿里云操作系统控制台提供了一站式解决方案,通过内存全景分析、文件缓存解析等功能,帮助用户精准定位和解决内存问题,提升系统性能和运维效率。控制台还支持共享内存泄露检测和内存QoS优化,确保业务稳定运行。未来将进一步提升AI运维能力和跨平台兼容性。

登录后可查看文章图片

科学普及

街边的台湾烤肠,为啥这么香

摘要

烤肠作为大众喜爱的美食,凭借其独特的香气和口感风靡各地。台湾烤肠源自大陆,结合中西工艺,注重甜口和肉感。其香气源于脂肪、香料及加热过程中的化学反应,通过烤肠机释放。烤肠虽美味,但高油高糖,企业正通过创新配方满足健康需求,同时保留其独特风味。

登录后可查看文章图片


‹ 2025-03-18 日报 2025-03-20 日报 ›

qrcode

关注公众号
接收推送