公司:阿里巴巴
阿里巴巴集团创立于1999年,是中国大陆一家以提供互联网服务为主的综合企业集团,目前实行位于杭州,上海与北京的双总部制度。
阿里巴巴服务范围包括B2B贸易、网上零售、购物搜索引擎、第三方支付和云计算服务。集团的子公司包括阿里巴巴B2B、淘宝网、天猫、一淘网、阿里云计算、聚划算、全球速卖通、阿里巴巴国际交易市场、饿了么、飞猪、优酷、盒马鲜生、阿里影业、菜鸟网络、高德地图、Lazada、Daraz等。旗下的淘宝网和天猫在2012年销售额达到1.1兆人民币,2015年度商品交易总额已经超过三兆元人民币,是全球最大零售商。
至2012年九月底止的财政年度,以美国会计准则计算,阿里营业额按年增长74%至318.39亿元(港元‧下同),盈利急升80%至37.75亿元。2015年全年,阿里巴巴营收146.01亿美元,净利为74.94亿美元。2017年,根据阿里巴巴集团向美国证券交易委员会提交的IPO招股书显示,雅虎持有阿里巴巴集团22.6%股权、软银持阿里集团34.4%股份,另管理层、雇员及其他投资者持股比例合共约为43%,当中马云持阿里巴巴集团约8.9%、蔡崇信持股为3.6%。
2019年11月,阿里巴巴集团在在港交所二次上市。香港财经界把阿里巴巴、腾讯(港交所:700)、美团点评(港交所:3690)、小米(港交所:1810)四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
2019年11月26日,阿里巴巴集团港股上市,总市值超4兆,登顶港股成为港股“新股王”。2020年8月,阿里巴巴集团港股总市值首次超过6万亿。
阿里巴巴拆份出去的蚂蚁集团上市前,网络金服整体遭遇到政府的强力监管,阿里巴巴同样受到影响,2021年4月10日,阿里巴巴集团涉垄断被中国市场监管总局罚款182.28亿元人民币。2023年三家中国最主要的金融机构,再联合开罚71亿元,不过也随着官方宣布最后整顿工作的完成,阿里巴巴股价开始反弹。
从browser-use 出发,品 Agent 实现
这篇文章以工程视角拆解Agent的实现原理,从Chat交互到WorkFlow编排再到自主Agent的演进历程。重点剖析了ReAct框架和Browser-use项目,详解记忆管理、规划策略、工具调用等核心模块的工程实现,并探讨了集成MCP协议扩展能力的方案。最后展望了分层规划、动态调整的未来Agent形态,为开发者提供了从理论到实践的完整学习路径。
理解Ray Data分布式数据处理原理-源码分析
Ray Data基于Ray构建,提供高性能分布式数据处理API,适用于AI批量推理等场景。其核心在于流式执行机制,通过Logical/Physical Operator转换形成执行DAG,以Block为最小单元并行处理数据。源码分析揭示了从数据读取、算子转换到流水线调度的全流程,ActorPoolMapOperator通过动态扩缩容Actor实现高效资源利用。这种设计让Ray Data能轻松处理超内存数据,同时保持异构计算资源的高效协同。
聊聊AI应用架构演进
AI应用架构从简单交互逐步演进,涉及Prompt调优、上下文增强、输入输出防护、意图路由、模型网关、缓存设计等关键技术。架构优化提升了模型推理性能,引入了Agent模式,实现了监控与日志管理。这些演进推动了AI应用的高效、安全与可扩展性,为复杂场景下的智能交互提供了坚实基础。
浅析 rust 大明星 Tokio
Tokio是Rust生态中高性能异步运行时库的核心担当,堪称异步任务的"智能调度中枢"。它将Future封装为任务,通过多级任务队列和窃取算法实现高效调度,配合Driver驱动完成I/O事件监听。相比Nginx的进程模型,Tokio的线程级调度更擅长处理复杂逻辑,其无锁队列和抢占机制巧妙平衡了效率与公平性。无论是网络服务还是实时系统,Tokio都是Rust异步编程的不二之选。
基于 Spring AI 的 MCP 客户端/服务端架构指南
随着AI技术的快速发展,企业级应用对模型能力需求激增,但数据孤岛和隐私安全问题成为主要挑战。模型上下文协议(MCP)应运而生,通过标准化接口实现模型与外部资源的动态交互,确保数据安全与灵活性。Spring AI框架深度集成MCP,提供高效的企业级解决方案,支持本地部署与实时联动,助力企业智能化升级。本文详细讲解如何基于Spring AI搭建MCP客户端与服务端,突破数据孤岛,构建安全可控的AI应用。
Agent工程能力思考记录
本文探讨了在大模型(LLM)时代下,如何重新定义业务核心资产以及Agent的演进与协作机制。文章从技术分层、Agent定义、协作模式、任务分配、冲突解决到工具调用标准(如MCP协议)等多个维度展开分析,并结合工程实践视角,提出了对Agent平台能力建设的思考,旨在为构建高效、灵活、可扩展的Agent系统提供参考。
RAG技巧与底层代码剖析
用Python基础库从零构建RAG系统,深入解析文本分块、向量化、语义搜索与生成优化。通过智能分块、动态上下文压缩等9大技巧,提升回答质量。从PDF提取文本到生成响应,逐行代码剖析RAG内核,助你彻底掌握底层逻辑,突破调参瓶颈,实现高效检索增强生成。
Deep Search 如何理解业务仓库代码?
Deep Search和Deep Research致力于深度挖掘信息,超越传统RAG的局限,提供更精准的洞察。Deep Search侧重全面检索,Deep Research侧重深入分析与创造。主流商业产品如OpenAI、Google和xAI集成检索能力,效果显著。开源方案通过优化查询和检索分析提升效率。代码领域中,Deep Search通过深度解析用户意图,精准匹配代码片段,生成结构化报告,提升代码检索与理解能力。未来将研发专用代码搜索Agent,增强领域知识和推理能力。
MCP Java 开发指南
Java开发者如何玩转MCP协议?这篇干货带你打通Python与Java的AI协作壁垒!从协议解析到实战落地,详解SSE与STDIO两种通信模式,手把手教你用原生SDK实现跨语言调用。遇到Spring AI的坑?别慌!这里还有绕过限制的终极方案,让你不改Python服务端就能轻松集成。AI时代,Java开发者也能成为模型调用的桥梁!
Cursor入门:MCP开发调用和项目实战
Cursor结合MCP、Docs、Rules等功能,展现了AI Coding的强大潜力。通过实战案例,如开发MCP Server和黄金价格预测项目,体验了从代码生成到项目构建的全流程。Cursor不仅提升了开发效率,还简化了前后端联调和API调试。虽然复杂项目仍需开发基础,但Cursor无疑为全栈开发提供了捷径。
当我们在谈多端一码时,我们在谈论什么
直播业务通过Kotlin Multiplatform(KMP)实现"多端一码",解决了多端逻辑差异问题。KMP支持代码复用、渐进式迁移,性能媲美原生,学习曲线平缓。团队从技术预研到复杂业务落地,验证了KMP在直播核心场景的可行性,如PM消息服务迁移和生命周期统一,显著提升了开发效率和稳定性,为未来UI与逻辑全面统一打下基础。
200行python代码实现从Bigram模型到LLM
从零开始,用200行Python代码实现了一个基于Transformer架构的GPT模型。通过逐步添加self-attention、position嵌入等机制,最终构建了一个完整的语言模型。模型在训练后能够生成更通顺的文本,展示了Transformer的强大能力。代码简洁明了,适合初学者理解和实践,为进一步优化和扩展奠定了基础。
从零开始200行python代码实现LLM
这篇文章手把手教你用Python从零实现一个极简版大语言模型!无需机器学习基础,只需会写Python代码,就能亲手搭建一个能生成古诗词的Bigram模型。通过具体代码示例,清晰展示了词汇表构建、概率统计、文本生成等关键步骤,还对比了传统方法与PyTorch实现的区别。跟着教程走,你不仅能理解tokenizer、embedding等核心概念,还能直观感受模型训练过程。最后实现的迷你模型虽然参数量仅39万,但已经能生成像模像样的诗词啦!
一文讲透程序编排的核心方式:从表达式语言到并行化实践
高德POI数据处理中,通过流程化配置和表达式语言提升开发效率。文章探讨了单语句表达式、类结构映射、流程化配置及并行化调度等编排方式,结合真实系统演进,分享高灵活性任务处理引擎的设计经验。这些编排方式适用于多种场景,助力复杂逻辑处理,提升系统设计能力。
大模型微调知识与实践分享
大模型微调全攻略来啦!从模型结构、参数量到显存计算,一文带你具象认识LLM。重点解析Prompt工程、数据构造和LoRA微调等关键技术,手把手教你用开源框架进行实践。还附赠推理加速技巧和效果评估方法,助你快速打造专属领域模型。无论是技术原理还是实操细节,这篇干货都能满足你的需求~
什么!我把SQL编辑器装进了大模型?
大型语言模型在生成SQL时易产生语法错误,难以满足企业级场景的精准需求。通过约束解码技术,结合上下文无关文法和Jinja模板引擎,实时过滤不合规的候选token,确保SQL语法正确且符合业务逻辑。该方案赋予LLM生成结构化数据的能力,提升输出准确性和可控性,助力智能数据管理平台构建。