公司:阿里巴巴
阿里巴巴集团创立于1999年,是中国大陆一家以提供互联网服务为主的综合企业集团,目前实行位于杭州,上海与北京的双总部制度。
阿里巴巴服务范围包括B2B贸易、网上零售、购物搜索引擎、第三方支付和云计算服务。集团的子公司包括阿里巴巴B2B、淘宝网、天猫、一淘网、阿里云计算、聚划算、全球速卖通、阿里巴巴国际交易市场、饿了么、飞猪、优酷、盒马鲜生、阿里影业、菜鸟网络、高德地图、Lazada、Daraz等。旗下的淘宝网和天猫在2012年销售额达到1.1兆人民币,2015年度商品交易总额已经超过三兆元人民币,是全球最大零售商。
至2012年九月底止的财政年度,以美国会计准则计算,阿里营业额按年增长74%至318.39亿元(港元‧下同),盈利急升80%至37.75亿元。2015年全年,阿里巴巴营收146.01亿美元,净利为74.94亿美元。2017年,根据阿里巴巴集团向美国证券交易委员会提交的IPO招股书显示,雅虎持有阿里巴巴集团22.6%股权、软银持阿里集团34.4%股份,另管理层、雇员及其他投资者持股比例合共约为43%,当中马云持阿里巴巴集团约8.9%、蔡崇信持股为3.6%。
2019年11月,阿里巴巴集团在在港交所二次上市。香港财经界把阿里巴巴、腾讯(港交所:700)、美团点评(港交所:3690)、小米(港交所:1810)四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
2019年11月26日,阿里巴巴集团港股上市,总市值超4兆,登顶港股成为港股“新股王”。2020年8月,阿里巴巴集团港股总市值首次超过6万亿。
阿里巴巴拆份出去的蚂蚁集团上市前,网络金服整体遭遇到政府的强力监管,阿里巴巴同样受到影响,2021年4月10日,阿里巴巴集团涉垄断被中国市场监管总局罚款182.28亿元人民币。2023年三家中国最主要的金融机构,再联合开罚71亿元,不过也随着官方宣布最后整顿工作的完成,阿里巴巴股价开始反弹。
详解大模型应用可观测全链路
阿里云针对LLM应用推出可观测解决方案,覆盖从硬件到软件的全链路监控。方案通过Trace、Metric、Log构建立体观测体系,支持自动化埋点、领域化指标洞察和用户体验监控。提供推理性能、Token消耗、调用链和会话分析视图,帮助开发者优化提示词调优,实现端到端全链路透视,提升应用稳定性和业务表现。
多模态自动布局技术发展及其在淘内内容场的应用
淘宝通过AIGC技术在手淘全流程中实现了内容生成的规模化应用,尤其在视频和图文生成方面取得突破。多模态自动布局技术结合计算机视觉与自然语言处理,自动化生成海报布局,显著提升设计效率。技术路线分为基于图像生成和基于坐标预测两种,后者通过LLM或diffusion模型直接预测布局坐标,优化了生成流程。该技术已广泛应用于营销图和视频封面生成,未来将探索多图布局、个性化风格及结合人工反馈的优化方向。
从零开始的DeepSeek微调训练实战(SFT)
本文介绍了如何使用unsloth框架对DeepSeek R1 Distill 7B模型进行高效微调,特别是针对医疗推理数据集的微调实验。通过最小可行性实验,初步验证了微调的效果,并逐步扩展到完整数据集进行大规模微调。微调后的模型在回答医学问题时表现更加规范,但仍需进一步优化。最终,模型权重被合并保存,为后续应用打下基础。
Transformer到底解决什么问题?
Transformer是NLP领域的重要突破,解决了长距离依赖和并行处理难题。它通过自注意力机制动态捕捉序列信息,结合多头注意力从多角度分析语义关系。相比RNN,Transformer摒弃了顺序计算,引入位置编码保留序列信息,实现了高效并行训练。其核心在于自注意力、多头注意力和前馈网络等模块的协同,为NLP任务提供了强大的建模能力。
从零开始教你打造一个MCP客户端
Anthropic开源的MCP协议为AI系统与数据源的连接提供了通用标准,取代了碎片化集成方式。通过MCP,开发者可以轻松构建客户端和服务器,实现AI与外部系统的交互。MCP支持多种功能类型,如资源、工具和提示,简化了开发流程,提升了系统可靠性。尽管生态尚不完善,但MCP的潜力巨大,未来有望成为AI系统集成的核心标准。
MLLM在电商域互动内容生产的实践
淘宝通过AIGC技术,实现了内容生成在多个场景的规模化应用。通过多模态reward模型、音视频联合预训练及专家模型蒸馏,提升了内容质量和用户体验。未来将结合用户画像与实时反馈,生成个性化互动内容,进一步优化电商互动效果。
AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了
大模型发展历程中,从早期的Word2Vec、ELMo到BERT、GPT系列,模型逐渐增大并展现出更强的上下文理解能力。GPT通过预训练和微调,逐步引入Zero-shot和Few-shot学习,最终通过RLHF等技术实现与人类意图的对齐。多模态模型如ViT和Gemini进一步扩展了模型处理文本、图像等多元数据的能力,推动AI向通用智能迈进。
AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了
大模型算法的发展历程,从传统机器学习到深度学习,最终走向预训练模型。机器学习通过特征工程和模型选择解决线性问题,深度学习通过神经网络处理非线性问题,而大模型则通过预训练和微调实现通用智能。算法演进的关键在于特征提取和模型优化,最终目标是实现高效、可迁移的智能系统。
schedule:原来还可以这样让进程让出 CPU?
本文探讨了通过模拟时钟中断和调度事件来优化和测试虚拟机监控器(VMM)的方法。详细介绍了流程设计、寄存器状态的保存与恢复、硬件中断处理规范等关键细节。文章还分析了如何在非抢占式内核中实现中断后的抢占式调度,并提出了避免死锁和金丝雀栈检查的解决方案。
大模型时代的视频动静态封面生产方案及业务实践
淘宝通过多模态大模型技术,推出封面生成AIAgent,解决视频和直播封面质量参差不齐的问题。系统包含规划、记忆、执行和反思模块,支持动态和静态封面生成,提升点击率与用户体验。技术方案利用ReKV流式视频处理、双阶段选帧和智能花字布局,确保封面美观且吸睛,有效促进内容消费和转化。
JDK21有没有什么稳定、简单又强势的特性?
Java虚拟线程在AJDK21.0.5中得到了进一步优化,解决了死锁(pin问题)等关键问题,提升了性能。通过减少线程创建和上下文切换,虚拟线程显著提高了高并发应用的效率。开发者只需调整线程创建部分代码,即可轻松使用虚拟线程,并可通过线程池实现限流。AJDK还提供了增强的诊断工具,帮助开发者更好地调试虚拟线程问题。
ComfyUI:搭积木一样构建专属于自己的AIGC工作流(保姆级教程)
通过ComfyUI构建文生图和文生动图工作流,本文详细介绍了从安装到使用的全流程。包括PyTorch和ComfyUI的安装、模型下载与导入、节点功能解析及工作流的搭建。还分享了LoRA模型的引入、插件的安装及文生动图的实现。最后展示了生成效果并提供了工作流文件,帮助用户快速上手AI图像生成。
大模型时代的内容分析Agent解决方案与业务实践
淘宝AIGC内容生成技术通过低成本、高时效的方式,解决了内容生产成本高的问题。通过视频生成、图文联合生成等技术,AIGC在手淘多个场景实现规模化落地。内容分析Agent自动生成内容特征体系,进行细粒度标注,挖掘优质内容特征,为商家、设计师等提供科学指导,提升内容生产效率和吸引力。
使用A10单卡24G复现DeepSeek R1强化学习过程
DeepSeek模型训练过程展示了其核心强化学习算法DeepSeek-R1-Zero的应用。通过监督微调和强化学习相结合,模型逐步提升了推理能力,解决了语言混合和可读性问题。训练中使用了多种奖励函数,确保输出格式和内容的准确性。实验表明,微调后模型在格式和答案上均表现优异,验证了强化学习在模型优化中的有效性。
视频级虚拟试衣技术在淘宝的产品化实践
淘宝通过AIGC技术显著提升了视频虚拟试穿效果,解决了图像换衣的局限性。视频换衣能够动态展示服饰特性,增强用户体验和商业价值。技术方面,采用3D VAE和DiT方案,提升了模型泛化能力和视频细节处理。产品上,提供了营销视频自动投放、模特试穿素材生成和买家试穿效果生成三大能力,助力平台、商家和买家更好地展示和体验服饰。
记一次内存利用率问题排查
升级至JDK 11后,应用出现内存利用率告警,排查发现是堆外内存管理策略变化所致。JDK 11默认使用HasCleaner策略,导致堆外内存增长,而JDK 8采用NoCleaner策略,内存占用较低。通过调整JVM参数,恢复NoCleaner策略,内存利用率显著下降,问题得以解决。