公司:阿里巴巴
阿里巴巴集团创立于1999年,是中国大陆一家以提供互联网服务为主的综合企业集团,目前实行位于杭州,上海与北京的双总部制度。
阿里巴巴服务范围包括B2B贸易、网上零售、购物搜索引擎、第三方支付和云计算服务。集团的子公司包括阿里巴巴B2B、淘宝网、天猫、一淘网、阿里云计算、聚划算、全球速卖通、阿里巴巴国际交易市场、饿了么、飞猪、优酷、盒马鲜生、阿里影业、菜鸟网络、高德地图、Lazada、Daraz等。旗下的淘宝网和天猫在2012年销售额达到1.1兆人民币,2015年度商品交易总额已经超过三兆元人民币,是全球最大零售商。
至2012年九月底止的财政年度,以美国会计准则计算,阿里营业额按年增长74%至318.39亿元(港元‧下同),盈利急升80%至37.75亿元。2015年全年,阿里巴巴营收146.01亿美元,净利为74.94亿美元。2017年,根据阿里巴巴集团向美国证券交易委员会提交的IPO招股书显示,雅虎持有阿里巴巴集团22.6%股权、软银持阿里集团34.4%股份,另管理层、雇员及其他投资者持股比例合共约为43%,当中马云持阿里巴巴集团约8.9%、蔡崇信持股为3.6%。
2019年11月,阿里巴巴集团在在港交所二次上市。香港财经界把阿里巴巴、腾讯(港交所:700)、美团点评(港交所:3690)、小米(港交所:1810)四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
2019年11月26日,阿里巴巴集团港股上市,总市值超4兆,登顶港股成为港股“新股王”。2020年8月,阿里巴巴集团港股总市值首次超过6万亿。
阿里巴巴拆份出去的蚂蚁集团上市前,网络金服整体遭遇到政府的强力监管,阿里巴巴同样受到影响,2021年4月10日,阿里巴巴集团涉垄断被中国市场监管总局罚款182.28亿元人民币。2023年三家中国最主要的金融机构,再联合开罚71亿元,不过也随着官方宣布最后整顿工作的完成,阿里巴巴股价开始反弹。
从零开始教你打造一个MCP客户端
Anthropic开源的MCP协议为AI系统与数据源的连接提供了通用标准,取代了碎片化集成方式。通过MCP,开发者可以轻松构建客户端和服务器,实现AI与外部系统的交互。MCP支持多种功能类型,如资源、工具和提示,简化了开发流程,提升了系统可靠性。尽管生态尚不完善,但MCP的潜力巨大,未来有望成为AI系统集成的核心标准。
MLLM在电商域互动内容生产的实践
淘宝通过AIGC技术,实现了内容生成在多个场景的规模化应用。通过多模态reward模型、音视频联合预训练及专家模型蒸馏,提升了内容质量和用户体验。未来将结合用户画像与实时反馈,生成个性化互动内容,进一步优化电商互动效果。
AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了
大模型发展历程中,从早期的Word2Vec、ELMo到BERT、GPT系列,模型逐渐增大并展现出更强的上下文理解能力。GPT通过预训练和微调,逐步引入Zero-shot和Few-shot学习,最终通过RLHF等技术实现与人类意图的对齐。多模态模型如ViT和Gemini进一步扩展了模型处理文本、图像等多元数据的能力,推动AI向通用智能迈进。
AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了
大模型算法的发展历程,从传统机器学习到深度学习,最终走向预训练模型。机器学习通过特征工程和模型选择解决线性问题,深度学习通过神经网络处理非线性问题,而大模型则通过预训练和微调实现通用智能。算法演进的关键在于特征提取和模型优化,最终目标是实现高效、可迁移的智能系统。
schedule:原来还可以这样让进程让出 CPU?
本文探讨了通过模拟时钟中断和调度事件来优化和测试虚拟机监控器(VMM)的方法。详细介绍了流程设计、寄存器状态的保存与恢复、硬件中断处理规范等关键细节。文章还分析了如何在非抢占式内核中实现中断后的抢占式调度,并提出了避免死锁和金丝雀栈检查的解决方案。
大模型时代的视频动静态封面生产方案及业务实践
淘宝通过多模态大模型技术,推出封面生成AIAgent,解决视频和直播封面质量参差不齐的问题。系统包含规划、记忆、执行和反思模块,支持动态和静态封面生成,提升点击率与用户体验。技术方案利用ReKV流式视频处理、双阶段选帧和智能花字布局,确保封面美观且吸睛,有效促进内容消费和转化。
JDK21有没有什么稳定、简单又强势的特性?
Java虚拟线程在AJDK21.0.5中得到了进一步优化,解决了死锁(pin问题)等关键问题,提升了性能。通过减少线程创建和上下文切换,虚拟线程显著提高了高并发应用的效率。开发者只需调整线程创建部分代码,即可轻松使用虚拟线程,并可通过线程池实现限流。AJDK还提供了增强的诊断工具,帮助开发者更好地调试虚拟线程问题。
ComfyUI:搭积木一样构建专属于自己的AIGC工作流(保姆级教程)
通过ComfyUI构建文生图和文生动图工作流,本文详细介绍了从安装到使用的全流程。包括PyTorch和ComfyUI的安装、模型下载与导入、节点功能解析及工作流的搭建。还分享了LoRA模型的引入、插件的安装及文生动图的实现。最后展示了生成效果并提供了工作流文件,帮助用户快速上手AI图像生成。
大模型时代的内容分析Agent解决方案与业务实践
淘宝AIGC内容生成技术通过低成本、高时效的方式,解决了内容生产成本高的问题。通过视频生成、图文联合生成等技术,AIGC在手淘多个场景实现规模化落地。内容分析Agent自动生成内容特征体系,进行细粒度标注,挖掘优质内容特征,为商家、设计师等提供科学指导,提升内容生产效率和吸引力。
使用A10单卡24G复现DeepSeek R1强化学习过程
DeepSeek模型训练过程展示了其核心强化学习算法DeepSeek-R1-Zero的应用。通过监督微调和强化学习相结合,模型逐步提升了推理能力,解决了语言混合和可读性问题。训练中使用了多种奖励函数,确保输出格式和内容的准确性。实验表明,微调后模型在格式和答案上均表现优异,验证了强化学习在模型优化中的有效性。
视频级虚拟试衣技术在淘宝的产品化实践
淘宝通过AIGC技术显著提升了视频虚拟试穿效果,解决了图像换衣的局限性。视频换衣能够动态展示服饰特性,增强用户体验和商业价值。技术方面,采用3D VAE和DiT方案,提升了模型泛化能力和视频细节处理。产品上,提供了营销视频自动投放、模特试穿素材生成和买家试穿效果生成三大能力,助力平台、商家和买家更好地展示和体验服饰。
记一次内存利用率问题排查
升级至JDK 11后,应用出现内存利用率告警,排查发现是堆外内存管理策略变化所致。JDK 11默认使用HasCleaner策略,导致堆外内存增长,而JDK 8采用NoCleaner策略,内存占用较低。通过调整JVM参数,恢复NoCleaner策略,内存利用率显著下降,问题得以解决。
select `*` from table 语法居然不报错?
MySQL中反引号用于引用数据库对象名称,而星号是通配符。正常情况下,select
* from table;
会报错,但某些版本却能执行成功。通过测试发现,MySQL 5.7.31修复了该问题,原因是反引号未正确处理星号。高版本通过新增类Item_asterisk专门处理通配符,解决了这一缺陷。建议使用dbdeployer工具快速构建不同版本数据库进行验证。
JVM 里的逻辑漏洞,居然让你的哈希表慢了 20%!
JDK 24 中 ConcurrentHashMap 性能提升 20%,源于 JVM 对标量替换优化的改进。逃逸分析和标量替换减少了对象堆分配,将对象字段拆散到寄存器或栈上,降低内存访问开销。优化过程中,IGVN 未能消除所有内存操作,导致标量替换失败。通过修改支配关系计算逻辑,成功修复了这一问题,提升了哈希表性能。
多模态人物视频驱动技术回顾与业务应用
多模态驱动的人物视频生成技术在商业、教育、医疗等领域具有广泛应用。本文回顾了口唇驱动、头部驱动和肢体驱动等关键技术,详细介绍了Wav2Lip、MuseTalk、Hallo等代表性研究,并探讨了其在淘天业务场景中的应用。通过低成本、高时效的AIGC内容生成能力,人物视频生成技术显著提升了运营效率和用户体验,推动了消费生态的建立。
LLM 联网搜索,到底是咋回事?
本文详细介绍了如何从零搭建一个具备联网搜索能力的本地聊天助手。通过Ollama配置本地LLM模型环境,结合Docker和Dify工具,实现模型部署与搜索逻辑设计。重点讲解了如何让模型判断是否需要搜索、生成关键词、抓取网页内容并提取关键信息,最终整合搜索结果生成回答。尽管本地运行存在性能瓶颈,但通过优化有望提升系统效率。