2025-03-13 16:30:00 ~ 2025-03-14 16:30:00
AI-Agent构建系列分为三部分:速通工作流基础、ComfyUI案例复盘、AI Agent构建案例。旨在帮助贯通工作流搭建,提升AIGC专业技能。AI迅猛发展下,大模型、多媒体生成、智能体、工作流广泛应用。AI Agent具备自主决策能力,AI Workflow注重标准化流程。通过赛博餐厅案例,展示工作流的基本构成与搭建思路,强调节点任务的输入、输出、参数配置,以及工作流的灵活扩展与升级。
登录后可查看文章图片
淘宝直播团队在AI技术应用上进行了多领域探索,包括服务端、前端、数据科学等,通过任务拆分、输入提炼、人机交互等方式提升效率。文章详细分析了AI的优势与局限,如文本生成能力与固定思维过程,并分享了RAG实践、FT调优等技术的具体应用。团队期待未来在垂直应用和基础能力建设上持续创新与合作。
登录后可查看文章图片
自动化测试中,JSON断言器是验证系统输出的关键,但传统方式效率低、维护难。本文揭秘如何构建高效、灵活的JSON断言器,涵盖架构设计、规则优化、核心算法及可视化功能。通过统一规则、灵活表达和易解析的设计,解决了断言结果的表达与可视化问题。未来可探索智能化断言和性能优化,进一步扩展应用场景。
登录后可查看文章图片
线程状态分析聚焦于WAITING
和TIMED_WAITING
,前者等待特定操作触发,后者设定时间限制自动恢复。线程池嵌套调用导致CPU频繁切换,建议统一线程池优化。火焰图揭示锁性能和CPU采样问题,getFatherActivity
大对象反序列化拖累性能,优化建议使用toMap
并减少循环内调用。并发线程执行结果工具类需处理异常日志,避免资源浪费。
登录后可查看文章图片
本文介绍了基于微调TrOCR模型的手写文本识别方法。使用GNHK手写笔记数据集,通过预处理将文档图像裁剪为单词图像,并生成对应的CSV文件。随后,对TrOCR模型进行微调,训练后使用验证集进行推理,结果显示模型表现优异,成功识别了大部分手写单词。整个过程包括数据预处理、模型训练和推理,展示了TrOCR在手写文本识别中的强大能力。
登录后可查看文章图片
淘宝首页“猜你喜欢”商品召回场景中,传统单用户向量模型存在训练效果不理想的问题。为此,我们提出了端到端的多兴趣建模新范式DM_Interest,通过联合训练一阶段兴趣预测和二阶段意图召回,显著提升了模型的表达能力和泛化性能。实验表明,DM_Interest在离线评测和线上实验中均表现出色,不仅召回类目更加丰富,命中率也更高,为个性化推荐提供了更精准的解决方案。
登录后可查看文章图片
bilibili会员购票务系统通过三阶段优化,提升高并发抢购场景下的稳定性。初始版本同步处理事务,但高并发下性能瓶颈明显;异步下单版本解耦请求与事务,降低DB压力;最终采用Redis缓存扣减库存,优化用户体验与系统性能,成功应对大规模抢购需求,保障系统稳定运行。
登录后可查看文章图片
大语言模型技术不断进步,OpenAI o1通过自我反思和错误修正提升推理能力,可能融合了CoT、PRM和MCTS;Kimi 1.5结合长上下文CoT和强化学习,展现了深入推理的潜力;Qwen 2.5则注重数据质量和多规模模型,配合离线与在线强化学习进一步提升性能。这些模型在推理、长文本处理和强化学习方面各有创新,推动了大语言模型的发展。
登录后可查看文章图片
京东广告团队提出了一种基于多模态大语言模型(MLLMs)的广告图片生成方法,旨在优化点击率(CTR)。通过预训练和强化学习微调,团队引入了一种新颖的奖励模型和以商品为中心的偏好优化策略,确保生成图片的视觉吸引力和商品相关性。实验表明,该方法在在线和离线指标上均达到了最先进的性能,显著提升了广告效果。
双11供应链大屏的稳定性保障,通过全链路流程图梳理风险点,分层处理数据接入、加工、存储和服务。技术策略包括高可用接口、监控前置、容错重算和快速恢复。业务促销策略灵活调整,确保数据准确性和接口稳定性。监控覆盖全环节,提前感知异常,保障大屏数据稳定可靠。
登录后可查看文章图片
AI编程助手的普及导致代码重构减少,重复代码增加,可能引发软件危机。尽管AI提升了开发效率,但忽视代码质量和技术债务的积累将影响系统长期维护。重构是保持代码结构优化的关键,然而其占比正急剧下降。未来,若不平衡开发速度与代码质量,短期的效率提升可能带来长期的技术灾难。
登录后可查看文章图片
智能体(Agent)是可感知环境并利用工具实现目标的应用程序,分为工作流系统和智能体系统。多智能体系统通过任务分解和专业化分工处理复杂任务,克服单智能体的局限性。框架如Swarm和AutoGen提供了轻量级和灵活的多智能体协调方式,适用于从教育到生产的多种场景。智能体协作模式包括动态任务规划和智能代理协调,提升系统整体性能。
登录后可查看文章图片
使用大语言模型(LLM)辅助编程需要合理预期和技巧。LLM本质是高级自动补全工具,擅长生成代码片段,但可能犯错。开发者应将其视为自信过度的编程助手,通过精准提示和对话管理上下文。LLM能加速原型开发,但需手动测试确保代码正确性。熟练掌握后,LLM能显著提升开发效率,尤其对复杂任务和代码重构有帮助。
登录后可查看文章图片
转转二手电商平台面临商品数据复杂、管理低效等运营难题,推出商品标签平台实现非标属性数据结构化,提升商品管理和用户体验。系统通过分层架构、事件驱动、多级缓存等技术,确保标签实时性、数据一致性和读取效率,支持精细化运营,未来计划扩展商品和标签维度,进一步提升平台效率。
登录后可查看文章图片
吃药时药片太大难吞咽,这问题挺普遍。药片大的原因一是剂量需求高,二是复方制剂和多层结构增加了体积,三是缓释和肠溶技术需要辅料和包衣。研究发现,圆形药片直径超8毫米,长形药片长宽高总和超2.1厘米,吞咽就会困难。吞药时可仰头用水冲服,或低头借助重力。但千万别因此不吃药。
登录后可查看文章图片
关注公众号
接收推送