公司:阿里巴巴
阿里巴巴集团创立于1999年,是中国大陆一家以提供互联网服务为主的综合企业集团,目前实行位于杭州,上海与北京的双总部制度。
阿里巴巴服务范围包括B2B贸易、网上零售、购物搜索引擎、第三方支付和云计算服务。集团的子公司包括阿里巴巴B2B、淘宝网、天猫、一淘网、阿里云计算、聚划算、全球速卖通、阿里巴巴国际交易市场、饿了么、飞猪、优酷、盒马鲜生、阿里影业、菜鸟网络、高德地图、Lazada、Daraz等。旗下的淘宝网和天猫在2012年销售额达到1.1兆人民币,2015年度商品交易总额已经超过三兆元人民币,是全球最大零售商。
至2012年九月底止的财政年度,以美国会计准则计算,阿里营业额按年增长74%至318.39亿元(港元‧下同),盈利急升80%至37.75亿元。2015年全年,阿里巴巴营收146.01亿美元,净利为74.94亿美元。2017年,根据阿里巴巴集团向美国证券交易委员会提交的IPO招股书显示,雅虎持有阿里巴巴集团22.6%股权、软银持阿里集团34.4%股份,另管理层、雇员及其他投资者持股比例合共约为43%,当中马云持阿里巴巴集团约8.9%、蔡崇信持股为3.6%。
2019年11月,阿里巴巴集团在在港交所二次上市。香港财经界把阿里巴巴、腾讯(港交所:700)、美团点评(港交所:3690)、小米(港交所:1810)四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
2019年11月26日,阿里巴巴集团港股上市,总市值超4兆,登顶港股成为港股“新股王”。2020年8月,阿里巴巴集团港股总市值首次超过6万亿。
阿里巴巴拆份出去的蚂蚁集团上市前,网络金服整体遭遇到政府的强力监管,阿里巴巴同样受到影响,2021年4月10日,阿里巴巴集团涉垄断被中国市场监管总局罚款182.28亿元人民币。2023年三家中国最主要的金融机构,再联合开罚71亿元,不过也随着官方宣布最后整顿工作的完成,阿里巴巴股价开始反弹。
【淘宝直播数字人互动LLM】告别AI感:基于真人ASR数据的拟人化探索
本文提出了一种基于真人直播ASR数据的拟人化训练方法,通过构建高质量〈AI回复, 拟人化回复〉数据对,训练拟人化改写模型,并结合GRPO强化学习,使生成模型直接输出自然、口语化、有帮助的回复。实验证明,该方法在保持准确性和帮助性的同时,显著提升了语音交互的真实感与用户体验。
自建一个 Agent 很难吗?一语道破,万语难明
我花一周时间为内部研发平台接入Agent开发能力,选用了Iframe嵌入方案,结合LangGraph和Next.js+React框架,优化了系统提示词和知识库建设,通过工具接入和上下文管理提升用户体验。压缩工具响应和上下文,确保Agent高效运行,解决复杂脚本处理中的注意力稀疏问题,实现连续对话和会话中断恢复。
Agentic Coding场景下基于职责分离的上下文管理思路分享
本文提出了一种基于“职责分离”思想的上下文管理新思路,将工具调用解耦为“行为”和“影响”,通过结构化、模块化的动态上下文设计,缓解长上下文导致的注意力稀释、信息过载等问题。引入记忆/遗忘机制、事实与行为记忆区分等策略,提升Agent在复杂编码任务中的稳定性和上下文利用效率。该思路虽源于coding场景,但具备跨任务复用潜力。
模型训练篇|多阶段ToolRL打造更可靠的AI导购助手
阿里芝麻租赁团队推出AI导购助手"租赁小不懂",通过架构革新与强化学习突破传统电商导购模式。针对租赁场景的复杂决策链,团队将多Agent架构升级为统一模型动态调用原子工具,响应速度提升4倍;创新两阶段RL训练法,使工具调用准确率提升3.23%。结合MoE模型优化,最终实现推荐成功率提升14.93%,推理显存降低40.6%,打造出更精准可靠的租赁顾问体验。
让 AI 写出生产级代码:阿里妈妈效果广告引擎AI Coding实践
在复杂生产系统中,通用AI编程模型难以胜任高质量代码生成。阿里妈妈团队通过构建CommonAds研发体系和智能研发助手「元芳」,探索出一套适用于广告引擎场景的AI Coding解决方案。该方案强调AI友好架构、规范驱动的多Agent协作以及工程化落地,实现了从需求到代码的全流程闭环,有效提升了代码生成的质量和效率。未来,团队将继续夯实AI-Friendly基础,延伸AI研发能力,推动下一代智能研发体系的构建。
RTP-LLM 在相关性大模型中的推理优化最佳实践
淘宝搜索引入3.5B MoE大模型优化相关性计算,面临超大BatchSize和超长Prompt的挑战。通过Proxy动态负载均衡、批次内KV-Cache复用和MoE Kernel动态调优等技术,成功将端到端延迟控制在500ms内,提升了搜索体验。未来将继续优化专家驻留和前缀复用,探索推理模型的性能极限。
漫说运维:LoongCollector 性能与稳定性技术大解密
LoongCollector在大规模云业务中脱颖而出,具备10倍吞吐和80%资源下降的显著优势。它通过零拷贝字符串处理、无锁事件池架构等技术,提升了日志采集的性能和可靠性。在多租户隔离、公平调度和自适应并发限制等方面表现卓越,确保高吞吐、低开销和稳定性,广泛应用于阿里云等企业环境。
从 ReAct 到 Ralph Loop:AI Agent 的持续迭代范式
AI编程助手常因自我评估机制不可靠而提前退出,导致任务未真正完成。Ralph Loop通过反复输入同一提示,让AI持续迭代直至任务完成,依赖外部状态形成自我参照的反馈循环。核心在于明确任务完成条件、Stop Hook阻止提前退出、max-iterations防止无限循环。适用于可验证任务,如测试迁移、代码重构等。
别再手写提示词!需求澄清 + 50多专业提示词框架自动匹配,效率提升10倍!
用户撰写提示词常遇表达不清、框架有限和套用耗时等问题。prompt-optimizer技能通过选择专业提示词框架、主动确认需求、自动套用框架和试用多种模型,解决这些痛点。AI Coding工具如Qoder、Cursor可辅助生成Skill,Claude Skills支持渐进式加载,提升效率。提示词优化Skill已开源,欢迎体验。
多 AI 协同 + SDD 编程实践:一个 AI 全流程交付实录
AI Coding技术快速发展,但复杂场景下仍面临Prompt调试困难、单一模型能力有限等问题。SDD规范驱动开发通过多模型协同互补,提升代码质量与可靠性。OpenSpec工具实现规范约束,Claude、CodeX、Gemini分工协作,从需求到实现步步验证,确保“写得对”。实践验证了SDD在复杂业务中的高效性与可控性。
Qoder @database功能上线!自动关联数据库 Schema,后端 AI Coding 效率拉满
Qoder JetBrains插件将数据库能力深度集成到AI开发流程中,一键连接数据库即可让AI获取完整表结构,支持SQL生成、执行与架构评审。通过@database功能直接引用Schema,结合自然语言交互,在Query Console中智能生成SQL语句。插件还支持DataGrip,提供斜杠指令快速操作,并可通过标注文件优化对遗留数据库的理解,显著提升数据库设计与开发效率。
吃灰 AI 眼镜爆改“交警 Copilot”,函数计算AgentRun 实操记录
Meta Ray-Ban眼镜通过turbometa-rayban-ai项目实现了中文支持和AI交互功能。作者结合阿里云函数计算AgentRun,设计了“端-管-云”架构,将眼镜作为客户端,云端进行数据处理和决策,实现了车牌识别与违章判断。AgentRun通过Prompt Engineering动态调整业务逻辑,FaaS模式则提升了系统的灵活性和成本效率。这一原型展示了AI眼镜在智能交通中的潜力。
淘宝订单列表体验优化实践
电商平台订单列表优化实践聚焦性能、交互和稳定性。通过双层预请求策略和多级缓存提升首屏加载速度;采用多实例架构保持Tab状态,实现流畅切换;优化缓存复用和并发控制,有效治理白屏问题。整体优化显著提升了缓存命中率、渲染性能和用户体验,为复杂业务场景提供了可复用的方法论。
SDD 如何在复杂业务系统中真正落地?
OpenSpec是一种基于规范的开发模式,通过CLI工具管理项目文档和AI工具配置,支持从初始化到归档的全流程操作。其核心在于将Spec文档视为代码的一部分,强调文档的不可变性和增量更新。开发者可通过简单的命令完成需求变更、任务管理和质量控制,确保AI生成的代码与项目规范一致。OpenSpec的设计理念是轻量、灵活,适合快速迭代和维护现有项目,而非从零构建新系统。
极速开发出一个高质量 Claude Agent Skills 最佳实践
Anthropic推出的Skill功能,让开发者能快速封装经验与流程为可复用的技能包。每个Skill包含YAML元数据和Markdown描述,支持渐进式加载资源。与MCP协议互补,Skill更轻量且适合知识传递。开发时需精简SKILL.md文件,采用洋葱式结构分层披露信息,并利用AI辅助生成高质量技能。核心在于清晰表达需求并提供充足上下文,而非手动编写细节。
淘宝发布生成式召回ALGR:让大语言模型学会推荐
大语言模型为电商推荐带来新突破。淘宝“首页猜你喜欢”引入生成式召回ALGR,通过语义ID+LLM技术,显著提升推荐效率和用户体验。ALGR采用近线构造和实时训练,优化特征Prompt、NSP建模和Scaling Law,实现离线Hitrate提升60%。性能优化方面,lm_head矩阵运算和动态宽度BeamSearch大幅减少训练显存和时间,推理性能提升500%~600%。ALGR全流量上线后,ipv和成交笔数分别增长0.44%和0.88%,为未来迭代奠定基础。