公司:阿里巴巴
阿里巴巴集团创立于1999年,是中国大陆一家以提供互联网服务为主的综合企业集团,目前实行位于杭州,上海与北京的双总部制度。
阿里巴巴服务范围包括B2B贸易、网上零售、购物搜索引擎、第三方支付和云计算服务。集团的子公司包括阿里巴巴B2B、淘宝网、天猫、一淘网、阿里云计算、聚划算、全球速卖通、阿里巴巴国际交易市场、饿了么、飞猪、优酷、盒马鲜生、阿里影业、菜鸟网络、高德地图、Lazada、Daraz等。旗下的淘宝网和天猫在2012年销售额达到1.1兆人民币,2015年度商品交易总额已经超过三兆元人民币,是全球最大零售商。
至2012年九月底止的财政年度,以美国会计准则计算,阿里营业额按年增长74%至318.39亿元(港元‧下同),盈利急升80%至37.75亿元。2015年全年,阿里巴巴营收146.01亿美元,净利为74.94亿美元。2017年,根据阿里巴巴集团向美国证券交易委员会提交的IPO招股书显示,雅虎持有阿里巴巴集团22.6%股权、软银持阿里集团34.4%股份,另管理层、雇员及其他投资者持股比例合共约为43%,当中马云持阿里巴巴集团约8.9%、蔡崇信持股为3.6%。
2019年11月,阿里巴巴集团在在港交所二次上市。香港财经界把阿里巴巴、腾讯(港交所:700)、美团点评(港交所:3690)、小米(港交所:1810)四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
2019年11月26日,阿里巴巴集团港股上市,总市值超4兆,登顶港股成为港股“新股王”。2020年8月,阿里巴巴集团港股总市值首次超过6万亿。
阿里巴巴拆份出去的蚂蚁集团上市前,网络金服整体遭遇到政府的强力监管,阿里巴巴同样受到影响,2021年4月10日,阿里巴巴集团涉垄断被中国市场监管总局罚款182.28亿元人民币。2023年三家中国最主要的金融机构,再联合开罚71亿元,不过也随着官方宣布最后整顿工作的完成,阿里巴巴股价开始反弹。
页面搭建方案(TurboUIBuilder)在穿搭星球的实践
手淘穿搭星球业务从Weex转向Native技术栈,推出TurboUIBuilder可视化页面搭建平台。通过Template-Container-Component三层结构,结合DX动态组件和keypath数据绑定,提升开发效率30%-50%,实现双端一致性与远程动态更新。内置核心服务如布局、数据、埋点等,优化用户体验,支持模板管理与AB测试,形成高稳定性、易扩展的Native页面构建引擎。
打通出行最后一公里|高德面向地铁场景的多模态智能图文引导系统
高德地图推出地铁站内多模态智能图文引导系统,填补“最后一公里”导航空白。该系统通过VR、图文和文字提示等多种方式,为用户提供无缝的端到端出行体验。技术方案包括数据采集、自动化审核、图文生产等环节,结合语音、视觉和多模态大模型,确保引导信息的精准性和清晰度。项目已全面覆盖地铁站内进站、出站、换乘场景,用户反馈积极。
淘宝搜索算法:推理型相关性LLM探索实践
电商搜索中,Query与商品相关性判别技术至关重要,直接影响用户体验和商家效率。传统BERT模型虽能处理大部分搜索需求,但在长尾复杂query上表现不足。本文提出基于大模型的优化框架,通过CoT微调、Pass@N-based DPO和动态采样GRPO,显著提升模型推理能力,解决了在线部署和错误累积问题,最终在难query评测集上取得显著效果。
从 yield 到 await:Python 协程的进化史
Python协程的演进史:从生成器到async/await的华丽转身!20年间,yield的诞生开启了协程雏形,社区用@wrappertask填补过渡期痛点,最终yield from实现标准代理,而async/await带来原生支持。这段技术进化告诉我们:优雅的语法背后,是无数实践打磨的智慧结晶~
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
这篇文章揭秘了一个能"自我编程"的智能Agent开发历程。通过Python+Java混合架构,让LLM生成的代码直接控制Agent行为,实现分支、循环等复杂逻辑。核心创新在于代码驱动机制:用Py4j桥接实现工具泛化调用,FIM格式精准续写代码,结合分层记忆系统实现持续学习。工程上采用模块化设计,将Agent划分为感知、认知、运动等智能分区,配合动态Prompt组装和上下文管理,最终打造出具备初级程序员水平的AI助手。
为什么说多模态是推荐系统破局的关键?来自饿了么一线的实战复盘
多模态推荐系统正从传统ID特征向丰富内容信息转变,结合大语言模型实现智能化推荐。饿了么首页店铺推荐场景通过多模态表征技术,解决了冷启动和跨场景迁移问题。生成式推荐利用量化编码与LLM结合,提升推荐精准度和可解释性。技术演进推动了推荐系统从匹配范式向生成范式的转变,展现了巨大潜力。
代码采纳率如何提升至50%?AI 自动编写单元测试实践总结
借助Aone Copilot Agent,AI辅助生成测试用例和代码修改,代码采纳率达50%。通过标准化Prompt设计,实现Spring Boot测试环境配置、数据驱动验证和场景全覆盖,提升开发效率和测试质量。AI生成代码具备清晰结构、充分注释和全面业务规则验证,显著缩短编写时间,确保测试独立性和一致性。持续优化Prompt和团队协作,进一步扩展AI应用场景,助力构建高质量测试体系。
让AI打出丝滑连招:编码-部署-自测-改bug
本文提出了一种测试驱动的AI编程闭环工作流,解决了AI生成代码后缺乏自测与迭代的问题。通过自动化验收和反馈机制,AI能像合格程序员一样完成自我修复与持续优化。实验以“收藏夹功能修复”为例,验证了该工作流的有效性,未来可通过增强测试、诊断、任务拆分等能力进一步提升自动化水平。
DMS Airflow:企业级数据工作流编排平台的专业实践
DMS Airflow 是基于 Apache Airflow 构建的企业级数据工作流编排平台,深度集成阿里云 DMS 系统,支持高级 DAG 编排、任务依赖管理、调度触发、状态监控等功能。其智能资源管理、多通道通知、动态 DAG 刷新等特性,提升了工作流的灵活性与效率,适用于数据 ETL、分析、同步等场景,助力数据团队高效调度与管理复杂任务。
重构一个类,JVM竟省下2.9G内存?
海量数据场景下,HashMap<Long, HashSet<String>>的内存开销巨大。通过重构为Long2ObjectOpenHashMap<int[]>,内存占用从3.13G降至200M,优化效果显著。int[]加二分查找替代HashSet,消除对象开销,提升内存效率。Long2ObjectOpenHashMap避免Long装箱,采用开放寻址,内存更紧凑。优化启示:内存敏感设计至关重要,避免通用容器在大数据下成为“内存黑洞”。
淘宝搜索算法:在大模型加持下的长尾复杂语义查询改写
淘宝搜索团队提出CSA-QR框架,解决长尾查询语义匹配难题。通过高质量数据生成、多维度对齐和强化学习三阶段优化,显著提升复杂查询的改写效果。实验显示,该方法在CTR、GMV等关键指标上均优于基线模型,已成功应用于淘宝搜索,改善用户体验。未来计划结合RAG技术解决时效性查询问题。
AI时代,我们为何重写规则引擎?—— QLExpress4 重构之路
QLExpress4通过全面重构,大幅提升性能、可观测性和AI友好性。编译性能提升10倍,执行性能翻倍,新增表达式追踪功能,方便AI调试规则。原生支持JSON语法,简化复杂数据结构构建。淘天集团和钉钉已广泛应用,助力规则归因聚类和模型动态映射。QLExpress4在AI时代下,持续满足开发者对规则引擎的旺盛需求。
无限创意,即刻成片:阿里妈妈推出“淘宝星辰·短视频”
阿里妈妈推出"淘宝星辰·短视频"AI生成方案,通过多模态大模型和视频生成技术,实现电商视频全自动生产。系统能深度解析商品卖点、智能创作剧本、自动剪辑素材,并支持图片转视频(I2V)功能,显著降低制作门槛。结合人设库与TTS语音合成,可生成风格多样的原生解说视频,帮助商家高效产出高质量营销内容。
TinyAI :全栈式轻量级 AI 框架
TinyAI是一个完全用Java实现的全栈轻量级AI框架,旨在为Java开发者提供从基础到应用的AI解决方案。其核心理念包括教育友好、模块化设计、生产级别和零外部依赖。TinyAI分层设计,包含16个核心模块,支持从数值计算到神经网络、自动微分、智能体系统等完整功能。项目还实现了GPT系列模型和现代架构如Qwen3,展示了Java在AI领域的潜力和创新。TinyAI不仅是技术框架,更是学习AI的优秀教材。
Midscene.js 实战与源码剖析:如何重塑 UI 自动化
Midscene.js是一款基于AI的下一代UI自动化工具,旨在解决传统UI自动化工具在元素选择器脆弱性、维护成本高、调试体验差和跨平台支持不足等问题。它利用视觉语言模型(VL模型)和多模态LLM模型,实现智能元素识别和自动化操作,提升测试和操作的效率与准确性。工具支持Chrome插件试用,通过自然语言描述操作意图,简化复杂场景的处理,适用于多种业务场景,如智能营销和智能发品。
ReAct范式深度解析:从理论到LangGraph实践
ReAct范式通过“思考-行动-观察-调整”循环,解决了传统AI在复杂任务中推理与行动脱节的问题。LangGraph框架实现了ReAct,支持动态决策、工具调用与状态管理,提升了AI的灵活性与透明度。实际项目中,ReAct在智能PPT生成等场景展现了显著优势,优化了决策过程与用户体验。