AI产品：Qwen的相关资料

GELab-Zero 技术解析：当豆包联手中兴，开源界如何守住端侧 AI 的“最后防线”？

2025年12月，AI端侧领域迎来两大突破：字节跳动豆包团队发布豆包手机助手，实现本地记忆与跨应用操作；阶跃星辰开源GELab-Zero-4B模型，推动4B参数模型在安卓设备上轻量化部署。GELab-Zero采用GUI视觉方案，通用兼容且隐私安全，解决了移动端Agent落地的核心挑战，展现了强大的多模态推理能力与工程化设计。

360技术

高德生成式推荐大模型｜用技术预估你接下来想做什么

高德地图推出G-Action生成式行为推荐框架，通过AI大模型预测用户出行意图。该技术结合时空、天气等实时数据，用自然语言理解用户行为流，精准推荐"动作+地点"组合。相比传统推荐，模型在Action预测准确率提升8.1%，并实现语义连贯的个性化推荐，如自动关联"导航-团购-评价"行为链。目前已在到店卡等场景取得显著效果，未来将持续优化多目标预估能力。

高德技术

AI Code与SpecKit结合，助力Java应用开发。SpecKit遵循SDD与TDD理念，通过结构化规范拆解开发流程，提升代码一致性、可维护性。实践表明，AI Coding在单兵作战中效率显著，但在成熟应用中需注意前后端协作与长期维护。选型上，cursor + claude 4.5组合表现优异，而idea + qwen code cli + qwen3 coder plus则适合高安全需求。开发过程中，SpecKit的步骤命令与过程命令有效辅助规范执行与细节调整。AI Coding推动开发流程标准化，未来需加强全局知识检索能力。

阿里巴巴技术

2025必看系列：AI如何重新定义研究？万字长文讲透Deep Research

AI研究新范式Deep Research崛起！从RAG到深度研究，AI正从被动检索升级为主动探索。四大核心模块——规划、问题演化、网页探索、报告生成——让AI像专家般拆解复杂任务。主流系统虽强，但数据单一性仍是痛点。腾讯Dola创新融合公私域数据，让分析更精准。这波AI进化浪潮，正在重塑研究方式！

腾讯技术

基于大模型增强的少样本学习在用户投诉意图感知中的应用

5G时代网络投诉处理面临少样本识别难题，传统小模型泛化能力不足，大模型又缺乏领域知识。创新方案来了！通过大模型生成高质量模拟样本，结合小模型反馈迭代优化，成功提升少样本投诉识别准确率21%，整体提升9%。实验证明，这种大小模型协同的增强学习框架既实用又高效，为通信领域智能化运维提供了新思路。

AICoding实践：从Prd到代码生成

AI编程系统CodeFuse正推动软件工程向"需求驱动型"变革，实现从自然语言需求到代码的端到端自动生成。面对复杂代码资产和业务理解难题，通过构建标准化Workflow、RAG检索和知识图谱增强上下文理解，结合分层生码与自动Review确保代码质量。目前安全域AI生成代码占比已达43%，在审理平台等场景实现单需求2万行代码生成，未来将持续强化技术风险防控与数据沉淀能力。

阿里巴巴技术

Evolution and Scale of Uber’s Delivery Search Platform

Uber Eats通过语义搜索提升用户体验，采用双塔模型和Qwen大语言模型，实现跨语言、跨领域的精准匹配。系统利用MRL技术优化嵌入维度，结合ANN索引和量化策略，平衡检索质量与计算成本。通过蓝绿部署和自动化验证，确保模型更新不中断服务，每两周刷新索引保持数据实时性，最终实现高效、低延迟的全球搜索系统。

uber技术

C3仓库AI代码门禁通用实践：基于Qwen3-Coder+RAG的代码评审

在C3级代码仓库中，团队通过Qwen3-Coder、RAG和Iflow实现了LLM代码评审的自动化实践。结合百炼Embedding构建知识索引，AI在CI流水线中自动触发评审，识别并发缺陷、资源泄漏等问题，显著提升评审效率与质量。AI评审已成功拦截多次高危缺陷，展现出与传统人工评审互补的优势，并在持续优化中探索修复建议生成。

阿里巴巴技术

不只是写代码：Qwen Code 如何规划、执行并验证软件工程任务

阿里推出的CLI工具Qwen Code，通过精细化Prompt设计，赋予大模型自主规划、编码、测试与验证能力。Qwen Code基于Qwen3-Coder模型，支持任务管理、工具调用和多步决策循环，显著提升开发效率与代码质量。其核心功能包括内置工具、任务跟踪与智能辅助决策，助力开发者从繁琐工作中解放，专注于创造性工作。

阿里巴巴技术

Qwen3 x ms-swift：监督微调在居住服务行业的一次实践

大模型微调在租房平台意图识别场景中展现显著优势，通过Qwen3-8B模型微调，准确率提升至94.5%，远超传统方法。微调不仅优化了模型性能，还降低了延迟，满足了实时交互需求。数据质量和多样性是微调成功的关键，少量高质量数据也能带来显著效果。ms-swift框架简化了训练流程，支持多尺寸模型微调，为业务提供了高效、低成本的解决方案。

阿里巴巴技术

主流大模型架构深度对比，涵盖 Llama、Qwen、DeepSeek 等六大模型

本文对比了2025年主流大型语言模型（LLM）的架构演进，重点分析了DeepSeek V3、OLMo 2、Gemma 3、Llama 4、Qwen3等模型的技术创新。DeepSeek V3采用多头潜在注意力和专家混合提升效率；OLMo 2通过后归一化和QK-范数优化训练稳定性；Gemma 3引入滑动窗口注意力降低计算成本；Llama 4和Qwen3则通过稀疏模型设计提高推理效率。各模型在架构上的细微调整展现了LLM领域的持续优化与创新。

Qwen3-Embedding 全揭秘：从技术到服务，打造高效AI产品的关键路径

Qwen3-Embedding是阿里通义实验室推出的新一代文本嵌入模型，支持多语言和灵活维度定制，在语义搜索、推荐系统等场景表现优异。通过PAI或百炼平台可快速部署，支持微调定制，相比大模型延迟更低、成本更优。实验显示其响应速度达毫秒级，成本仅为LLM的1/4，适合高并发场景。提供缓存、降级等工程优化方案，助力开发者高效构建智能应用。

阿里巴巴技术

用Qwen3 Embedding+Milvus，搭建最强企业知识库

阿里低调发布Qwen3-Embedding和Qwen3-Reranker两款新模型，支持119种语言，在多语言任务中表现优异。教程手把手教你用这两款模型搭建RAG系统，通过两阶段检索设计（召回+重排）平衡效率与精度。从环境准备、数据加载到结合重排序技术增强RAG，完整流程清晰易懂，适合开发者快速上手。

多快好省，Qwen3混合部署模式引爆MCP

MCP（Model Context Protocol）通过Host、Client、Server三个核心组件，实现AI与外部工具和数据源的灵活交互。Claude模型通过prompt智能选择工具，执行后反馈结果生成最终回应。Qwen3采用混合专家架构，支持119种语言，性能大幅提升，部署成本降低，提供多种模型版本，适用于不同场景。通过MCP，用户可轻松调用现成工具，开发者则能快速构建自定义服务器。

阿里巴巴技术

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

本文介绍了如何通过MCP协议接入Qwen3-235B-A22B大模型，结合ComfyUI实现AI云服务的数据互通。方案展示了从本地读取prompt生成图片，并自动发布到小红书的全流程。MCP的扩展性和易用性使其在AI场景中具有广泛的应用潜力，如订单管理、具身智能等。尽管存在模型智能度和安全风险等挑战，MCP的未来发展前景依然广阔。

阿里巴巴技术

A Step-by-Step Guide to Creating a Custom Vision-Language Dataset for Fine-Tuning Qwen-2-VL with LLaMA-Factory

本文将指导如何为Qwen-2-VL视觉语言模型创建定制数据集，并使用LLaMA-Factory进行微调。首先，准备合同文档图片并生成问答对，利用GPT-4模型自动生成问题与答案。接着，将数据集上传至Hugging Face Hub，最后配置并运行微调脚本。该流程适用于文档视觉问答等任务，帮助构建专用模型，提升性能。