知鸦日报2025-03-14

2025-03-13 16:30:00 ~ 2025-03-14 16:30:00

プロダクト

即刻产品：造个Agent牛马帮我消化Super Boss的需求！【工作流基础速通篇】

摘要

AI-Agent构建系列分为三部分：速通工作流基础、ComfyUI案例复盘、AI Agent构建案例。旨在帮助贯通工作流搭建，提升AIGC专业技能。AI迅猛发展下，大模型、多媒体生成、智能体、工作流广泛应用。AI Agent具备自主决策能力，AI Workflow注重标准化流程。通过赛博餐厅案例，展示工作流的基本构成与搭建思路，强调节点任务的输入、输出、参数配置，以及工作流的灵活扩展与升级。

登录后可查看文章图片

テクノロジー

阿里巴巴技术：淘宝直播AI提效探索的一些心得

摘要

淘宝直播团队在AI技术应用上进行了多领域探索，包括服务端、前端、数据科学等，通过任务拆分、输入提炼、人机交互等方式提升效率。文章详细分析了AI的优势与局限，如文本生成能力与固定思维过程，并分享了RAG实践、FT调优等技术的具体应用。团队期待未来在垂直应用和基础能力建设上持续创新与合作。

登录后可查看文章图片

酷家乐技术：JSON 断言器，让测试自动化效能狂飙

摘要

自动化测试中，JSON断言器是验证系统输出的关键，但传统方式效率低、维护难。本文揭秘如何构建高效、灵活的JSON断言器，涵盖架构设计、规则优化、核心算法及可视化功能。通过统一规则、灵活表达和易解析的设计，解决了断言结果的表达与可视化问题。未来可探索智能化断言和性能优化，进一步扩展应用场景。

登录后可查看文章图片

京东技术：线上机器CPU占用高分析实践

摘要

线程状态分析聚焦于WAITING和TIMED_WAITING，前者等待特定操作触发，后者设定时间限制自动恢复。线程池嵌套调用导致CPU频繁切换，建议统一线程池优化。火焰图揭示锁性能和CPU采样问题，getFatherActivity大对象反序列化拖累性能，优化建议使用toMap并减少循环内调用。并发线程执行结果工具类需处理异常日志，避免资源浪费。

登录后可查看文章图片

使用OCR识别手写文本

摘要

本文介绍了基于微调TrOCR模型的手写文本识别方法。使用GNHK手写笔记数据集，通过预处理将文档图像裁剪为单词图像，并生成对应的CSV文件。随后，对TrOCR模型进行微调，训练后使用验证集进行推理，结果显示模型表现优异，成功识别了大部分手写单词。整个过程包括数据预处理、模型训练和推理，展示了TrOCR在手写文本识别中的强大能力。

登录后可查看文章图片

阿里巴巴技术：淘宝推荐算法系列：首猜两阶段端到端多兴趣新范式

摘要

淘宝首页“猜你喜欢”商品召回场景中，传统单用户向量模型存在训练效果不理想的问题。为此，我们提出了端到端的多兴趣建模新范式DM_Interest，通过联合训练一阶段兴趣预测和二阶段意图召回，显著提升了模型的表达能力和泛化性能。实验表明，DM_Interest在离线评测和线上实验中均表现出色，不仅召回类目更加丰富，命中率也更高，为个性化推荐提供了更精准的解决方案。

登录后可查看文章图片

哔哩哔哩技术：B站票务抢购下单流程演进

摘要

bilibili会员购票务系统通过三阶段优化，提升高并发抢购场景下的稳定性。初始版本同步处理事务，但高并发下性能瓶颈明显；异步下单版本解耦请求与事务，降低DB压力；最终采用Redis缓存扣减库存，优化用户体验与系统性能，成功应对大规模抢购需求，保障系统稳定运行。

登录后可查看文章图片

在DeepSeek阴影（或启发）下：OpenAI o1、Kimi 1.5、Qwen 2.5技术路线解读

摘要

大语言模型技术不断进步，OpenAI o1通过自我反思和错误修正提升推理能力，可能融合了CoT、PRM和MCTS；Kimi 1.5结合长上下文CoT和强化学习，展现了深入推理的潜力；Qwen 2.5则注重数据质量和多规模模型，配合离线与在线强化学习进一步提升性能。这些模型在推理、长文本处理和强化学习方面各有创新，推动了大语言模型的发展。

登录后可查看文章图片

京东技术：京东零售广告创意：引入场域目标的创意图片生成

摘要

京东广告团队提出了一种基于多模态大语言模型（MLLMs）的广告图片生成方法，旨在优化点击率（CTR）。通过预训练和强化学习微调，团队引入了一种新颖的奖励模型和以商品为中心的偏好优化策略，确保生成图片的视觉吸引力和商品相关性。实验表明，该方法在在线和离线指标上均达到了最先进的性能，显著提升了广告效果。

京东技术：揭秘双11保障：深度解析物流CEO大屏与供应链大屏的稳定性保障机制

摘要

双11供应链大屏的稳定性保障，通过全链路流程图梳理风险点，分层处理数据接入、加工、存储和服务。技术策略包括高可用接口、监控前置、容错重算和快速恢复。业务促销策略灵活调整，确保数据准确性和接口稳定性。监控覆盖全环节，提前感知异常，保障大屏数据稳定可靠。

登录后可查看文章图片

新东方技术：AI 生成的代码缺少什么？

摘要

AI编程助手的普及导致代码重构减少，重复代码增加，可能引发软件危机。尽管AI提升了开发效率，但忽视代码质量和技术债务的积累将影响系统长期维护。重构是保持代码结构优化的关键，然而其占比正急剧下降。未来，若不平衡开发速度与代码质量，短期的效率提升可能带来长期的技术灾难。

登录后可查看文章图片

阿里巴巴技术：主流多智能体框架设计原理

摘要

智能体（Agent）是可感知环境并利用工具实现目标的应用程序，分为工作流系统和智能体系统。多智能体系统通过任务分解和专业化分工处理复杂任务，克服单智能体的局限性。框架如Swarm和AutoGen提供了轻量级和灵活的多智能体协调方式，适用于从教育到生产的多种场景。智能体协作模式包括动态任务规划和智能代理协调，提升系统整体性能。

登录后可查看文章图片

Here’s how I use LLMs to help me write code

摘要

使用大语言模型（LLM）辅助编程需要合理预期和技巧。LLM本质是高级自动补全工具，擅长生成代码片段，但可能犯错。开发者应将其视为自信过度的编程助手，通过精准提示和对话管理上下文。LLM能加速原型开发，但需手动测试确保代码正确性。熟练掌握后，LLM能显著提升开发效率，尤其对复杂任务和代码重构有帮助。

登录后可查看文章图片

58同城技术：转转运营系统之商品标签平台

摘要

转转二手电商平台面临商品数据复杂、管理低效等运营难题，推出商品标签平台实现非标属性数据结构化，提升商品管理和用户体验。系统通过分层架构、事件驱动、多级缓存等技术，确保标签实时性、数据一致性和读取效率，支持精细化运营，未来计划扩展商品和标签维度，进一步提升平台效率。

登录后可查看文章图片

科学普及

反人类的巨大药片，到底为啥要设计成这样

摘要

吃药时药片太大难吞咽，这问题挺普遍。药片大的原因一是剂量需求高，二是复方制剂和多层结构增加了体积，三是缓释和肠溶技术需要辅料和包衣。研究发现，圆形药片直径超8毫米，长形药片长宽高总和超2.1厘米，吞咽就会困难。吞药时可仰头用水冲服，或低头借助重力。但千万别因此不吃药。

登录后可查看文章图片

‹ 2025-03-13 日报 2025-03-15 日报 ›