公司:阿里巴巴
阿里巴巴集团创立于1999年,是中国大陆一家以提供互联网服务为主的综合企业集团,目前实行位于杭州,上海与北京的双总部制度。
阿里巴巴服务范围包括B2B贸易、网上零售、购物搜索引擎、第三方支付和云计算服务。集团的子公司包括阿里巴巴B2B、淘宝网、天猫、一淘网、阿里云计算、聚划算、全球速卖通、阿里巴巴国际交易市场、饿了么、飞猪、优酷、盒马鲜生、阿里影业、菜鸟网络、高德地图、Lazada、Daraz等。旗下的淘宝网和天猫在2012年销售额达到1.1兆人民币,2015年度商品交易总额已经超过三兆元人民币,是全球最大零售商。
至2012年九月底止的财政年度,以美国会计准则计算,阿里营业额按年增长74%至318.39亿元(港元‧下同),盈利急升80%至37.75亿元。2015年全年,阿里巴巴营收146.01亿美元,净利为74.94亿美元。2017年,根据阿里巴巴集团向美国证券交易委员会提交的IPO招股书显示,雅虎持有阿里巴巴集团22.6%股权、软银持阿里集团34.4%股份,另管理层、雇员及其他投资者持股比例合共约为43%,当中马云持阿里巴巴集团约8.9%、蔡崇信持股为3.6%。
2019年11月,阿里巴巴集团在在港交所二次上市。香港财经界把阿里巴巴、腾讯(港交所:700)、美团点评(港交所:3690)、小米(港交所:1810)四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
2019年11月26日,阿里巴巴集团港股上市,总市值超4兆,登顶港股成为港股“新股王”。2020年8月,阿里巴巴集团港股总市值首次超过6万亿。
阿里巴巴拆份出去的蚂蚁集团上市前,网络金服整体遭遇到政府的强力监管,阿里巴巴同样受到影响,2021年4月10日,阿里巴巴集团涉垄断被中国市场监管总局罚款182.28亿元人民币。2023年三家中国最主要的金融机构,再联合开罚71亿元,不过也随着官方宣布最后整顿工作的完成,阿里巴巴股价开始反弹。
如何监控vLLM等大模型推理性能?
本文探讨了AI推理应用的可观测性需求,提出了基于Prometheus的完整监控方案,涵盖性能、资源利用率、模型行为及分布式架构等方面。通过Ray Serve和vLLM框架的实践,详细展示了如何采集和分析推理应用的各项指标,确保高效、稳定的推理服务。全链路监控方案为开发者提供了全面的可观测性支持,助力AI推理应用的优化与扩展。
阿里云资深架构师经验分享——DevSecOps最佳实践
阿里云在DevSecOps实践中,通过专业工具链和系统化方法,将安全融入产品开发全流程。设计环节中,安全架构师与安全工程师协作,确保架构安全。阿里云还通过分层防御和零信任体系,构建了纵深防护机制,有效应对复杂安全挑战,保障云产品安全水位。
AI赋能:大模型创新的模板生成与内容填充
淘宝利用AIGC技术优化内容生成,从信息流到详情页全方位提升用户体验。通过大模型的强大能力,自动生成图文导购模板,简化设计和转译流程,显著降低时间和人力成本。AI自动识别和填充模板坑位,适应动态内容变化,提升灵活性和精准性。未来,大模型将进一步推动内容创作的智能化和个性化,为用户提供更优质购物体验。
AI 推理场景的痛点和解决方案
推理服务面临限流、负载均衡、异步化、数据管理和索引增强等挑战。通过Tair数据库的丰富数据结构,如限流、负载均衡、异步处理和向量检索,能有效解决这些问题。Tair在性能、扩展性和持久化方面表现优异,适合推理场景的高效需求,提升系统稳定性和响应速度。
淘宝直播AI提效探索的一些心得
淘宝直播团队在AI技术应用上进行了多领域探索,包括服务端、前端、数据科学等,通过任务拆分、输入提炼、人机交互等方式提升效率。文章详细分析了AI的优势与局限,如文本生成能力与固定思维过程,并分享了RAG实践、FT调优等技术的具体应用。团队期待未来在垂直应用和基础能力建设上持续创新与合作。
淘宝推荐算法系列:首猜两阶段端到端多兴趣新范式
淘宝首页“猜你喜欢”商品召回场景中,传统单用户向量模型存在训练效果不理想的问题。为此,我们提出了端到端的多兴趣建模新范式DM_Interest,通过联合训练一阶段兴趣预测和二阶段意图召回,显著提升了模型的表达能力和泛化性能。实验表明,DM_Interest在离线评测和线上实验中均表现出色,不仅召回类目更加丰富,命中率也更高,为个性化推荐提供了更精准的解决方案。
主流多智能体框架设计原理
智能体(Agent)是可感知环境并利用工具实现目标的应用程序,分为工作流系统和智能体系统。多智能体系统通过任务分解和专业化分工处理复杂任务,克服单智能体的局限性。框架如Swarm和AutoGen提供了轻量级和灵活的多智能体协调方式,适用于从教育到生产的多种场景。智能体协作模式包括动态任务规划和智能代理协调,提升系统整体性能。
详解大模型应用可观测全链路
阿里云针对LLM应用推出可观测解决方案,覆盖从硬件到软件的全链路监控。方案通过Trace、Metric、Log构建立体观测体系,支持自动化埋点、领域化指标洞察和用户体验监控。提供推理性能、Token消耗、调用链和会话分析视图,帮助开发者优化提示词调优,实现端到端全链路透视,提升应用稳定性和业务表现。
多模态自动布局技术发展及其在淘内内容场的应用
淘宝通过AIGC技术在手淘全流程中实现了内容生成的规模化应用,尤其在视频和图文生成方面取得突破。多模态自动布局技术结合计算机视觉与自然语言处理,自动化生成海报布局,显著提升设计效率。技术路线分为基于图像生成和基于坐标预测两种,后者通过LLM或diffusion模型直接预测布局坐标,优化了生成流程。该技术已广泛应用于营销图和视频封面生成,未来将探索多图布局、个性化风格及结合人工反馈的优化方向。
从零开始的DeepSeek微调训练实战(SFT)
本文介绍了如何使用unsloth框架对DeepSeek R1 Distill 7B模型进行高效微调,特别是针对医疗推理数据集的微调实验。通过最小可行性实验,初步验证了微调的效果,并逐步扩展到完整数据集进行大规模微调。微调后的模型在回答医学问题时表现更加规范,但仍需进一步优化。最终,模型权重被合并保存,为后续应用打下基础。
Transformer到底解决什么问题?
Transformer是NLP领域的重要突破,解决了长距离依赖和并行处理难题。它通过自注意力机制动态捕捉序列信息,结合多头注意力从多角度分析语义关系。相比RNN,Transformer摒弃了顺序计算,引入位置编码保留序列信息,实现了高效并行训练。其核心在于自注意力、多头注意力和前馈网络等模块的协同,为NLP任务提供了强大的建模能力。
从零开始教你打造一个MCP客户端
Anthropic开源的MCP协议为AI系统与数据源的连接提供了通用标准,取代了碎片化集成方式。通过MCP,开发者可以轻松构建客户端和服务器,实现AI与外部系统的交互。MCP支持多种功能类型,如资源、工具和提示,简化了开发流程,提升了系统可靠性。尽管生态尚不完善,但MCP的潜力巨大,未来有望成为AI系统集成的核心标准。
MLLM在电商域互动内容生产的实践
淘宝通过AIGC技术,实现了内容生成在多个场景的规模化应用。通过多模态reward模型、音视频联合预训练及专家模型蒸馏,提升了内容质量和用户体验。未来将结合用户画像与实时反馈,生成个性化互动内容,进一步优化电商互动效果。
AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了
大模型发展历程中,从早期的Word2Vec、ELMo到BERT、GPT系列,模型逐渐增大并展现出更强的上下文理解能力。GPT通过预训练和微调,逐步引入Zero-shot和Few-shot学习,最终通过RLHF等技术实现与人类意图的对齐。多模态模型如ViT和Gemini进一步扩展了模型处理文本、图像等多元数据的能力,推动AI向通用智能迈进。
AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了
大模型算法的发展历程,从传统机器学习到深度学习,最终走向预训练模型。机器学习通过特征工程和模型选择解决线性问题,深度学习通过神经网络处理非线性问题,而大模型则通过预训练和微调实现通用智能。算法演进的关键在于特征提取和模型优化,最终目标是实现高效、可迁移的智能系统。
schedule:原来还可以这样让进程让出 CPU?
本文探讨了通过模拟时钟中断和调度事件来优化和测试虚拟机监控器(VMM)的方法。详细介绍了流程设计、寄存器状态的保存与恢复、硬件中断处理规范等关键细节。文章还分析了如何在非抢占式内核中实现中断后的抢占式调度,并提出了避免死锁和金丝雀栈检查的解决方案。