话题AI产品 › Qwen

AI产品:Qwen

关联话题: 通义千问

破解集合价值建模与实时推理难题:生成式召回大模型的工业级落地实践 | 搜索广告AI大模型创新实践

阿里妈妈搜索广告团队创新推出GFlowGR、NEZHA和VALUE三大技术,解决生成式召回中的价值差异化建模、实时推理延迟和语义质量平衡难题。GFlowGR通过GFlowNet框架实现商品价值精准度量,NEZHA采用轻量解码架构达成毫秒级响应,VALUE则结合加权Trie树兼顾语义与商业价值。这些技术已在阿里妈妈搜索广告主场景全量上线,带来大盘营收显著提升8%。

高德AI研发工作流实践解析:ACoder平台实现研发效率5-20倍提升

ACoder平台通过多模型协作,解决了AI Coding在垂域知识传递、研发全链路提效及架构腐化等核心挑战。其DeepDiscovery技术增强了大模型对大规模工程的理解能力,实现了代码生成的高效与精准。平台在鸿蒙开发中提效显著,推动研发模式向AI驱动转型,提升了代码理解与生成的协同效率。

淘宝搜索算法:推理范式下生成式检索应用

大语言模型在电商领域的应用展现了显著优势,通过构建个性化生成式推理模型,深入分析用户属性、搜索词和行为序列,精准推断用户意图并生成商品推荐。优化方案从语义ID、PreSFT和SFT三阶段入手,提升模型表现。实验结果显示,成交笔数和金额均有增长,验证了生成式召回范式的潜力。未来将探索双LLM架构和RL技术,进一步提升模型能力。

GELab-Zero 技术解析:当豆包联手中兴,开源界如何守住端侧 AI 的“最后防线”?

2025年12月,AI端侧领域迎来两大突破:字节跳动豆包团队发布豆包手机助手,实现本地记忆与跨应用操作;阶跃星辰开源GELab-Zero-4B模型,推动4B参数模型在安卓设备上轻量化部署。GELab-Zero采用GUI视觉方案,通用兼容且隐私安全,解决了移动端Agent落地的核心挑战,展现了强大的多模态推理能力与工程化设计。

高德生成式推荐大模型|用技术预估你接下来想做什么

高德地图推出G-Action生成式行为推荐框架,通过AI大模型预测用户出行意图。该技术结合时空、天气等实时数据,用自然语言理解用户行为流,精准推荐"动作+地点"组合。相比传统推荐,模型在Action预测准确率提升8.1%,并实现语义连贯的个性化推荐,如自动关联"导航-团购-评价"行为链。目前已在到店卡等场景取得显著效果,未来将持续优化多目标预估能力。

SpecKit 在成熟 Java 项目中的 AI 编码实践

AI Code与SpecKit结合,助力Java应用开发。SpecKit遵循SDD与TDD理念,通过结构化规范拆解开发流程,提升代码一致性、可维护性。实践表明,AI Coding在单兵作战中效率显著,但在成熟应用中需注意前后端协作与长期维护。选型上,cursor + claude 4.5组合表现优异,而idea + qwen code cli + qwen3 coder plus则适合高安全需求。开发过程中,SpecKit的步骤命令与过程命令有效辅助规范执行与细节调整。AI Coding推动开发流程标准化,未来需加强全局知识检索能力。

2025必看系列:AI如何重新定义研究?万字长文讲透Deep Research

AI研究新范式Deep Research崛起!从RAG到深度研究,AI正从被动检索升级为主动探索。四大核心模块——规划、问题演化、网页探索、报告生成——让AI像专家般拆解复杂任务。主流系统虽强,但数据单一性仍是痛点。腾讯Dola创新融合公私域数据,让分析更精准。这波AI进化浪潮,正在重塑研究方式!

基于大模型增强的少样本学习在用户投诉意图感知中的应用

5G时代网络投诉处理面临少样本识别难题,传统小模型泛化能力不足,大模型又缺乏领域知识。创新方案来了!通过大模型生成高质量模拟样本,结合小模型反馈迭代优化,成功提升少样本投诉识别准确率21%,整体提升9%。实验证明,这种大小模型协同的增强学习框架既实用又高效,为通信领域智能化运维提供了新思路。

AICoding实践:从Prd到代码生成

AI编程系统CodeFuse正推动软件工程向"需求驱动型"变革,实现从自然语言需求到代码的端到端自动生成。面对复杂代码资产和业务理解难题,通过构建标准化Workflow、RAG检索和知识图谱增强上下文理解,结合分层生码与自动Review确保代码质量。目前安全域AI生成代码占比已达43%,在审理平台等场景实现单需求2万行代码生成,未来将持续强化技术风险防控与数据沉淀能力。

Evolution and Scale of Uber’s Delivery Search Platform

Uber Eats通过语义搜索提升用户体验,采用双塔模型和Qwen大语言模型,实现跨语言、跨领域的精准匹配。系统利用MRL技术优化嵌入维度,结合ANN索引和量化策略,平衡检索质量与计算成本。通过蓝绿部署和自动化验证,确保模型更新不中断服务,每两周刷新索引保持数据实时性,最终实现高效、低延迟的全球搜索系统。

C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审

在C3级代码仓库中,团队通过Qwen3-Coder、RAG和Iflow实现了LLM代码评审的自动化实践。结合百炼Embedding构建知识索引,AI在CI流水线中自动触发评审,识别并发缺陷、资源泄漏等问题,显著提升评审效率与质量。AI评审已成功拦截多次高危缺陷,展现出与传统人工评审互补的优势,并在持续优化中探索修复建议生成。

不只是写代码:Qwen Code 如何规划、执行并验证软件工程任务

阿里推出的CLI工具Qwen Code,通过精细化Prompt设计,赋予大模型自主规划、编码、测试与验证能力。Qwen Code基于Qwen3-Coder模型,支持任务管理、工具调用和多步决策循环,显著提升开发效率与代码质量。其核心功能包括内置工具、任务跟踪与智能辅助决策,助力开发者从繁琐工作中解放,专注于创造性工作。

Qwen3 x ms-swift:监督微调在居住服务行业的一次实践

大模型微调在租房平台意图识别场景中展现显著优势,通过Qwen3-8B模型微调,准确率提升至94.5%,远超传统方法。微调不仅优化了模型性能,还降低了延迟,满足了实时交互需求。数据质量和多样性是微调成功的关键,少量高质量数据也能带来显著效果。ms-swift框架简化了训练流程,支持多尺寸模型微调,为业务提供了高效、低成本的解决方案。

主流大模型架构深度对比,涵盖 Llama、Qwen、DeepSeek 等六大模型

本文对比了2025年主流大型语言模型(LLM)的架构演进,重点分析了DeepSeek V3、OLMo 2、Gemma 3、Llama 4、Qwen3等模型的技术创新。DeepSeek V3采用多头潜在注意力和专家混合提升效率;OLMo 2通过后归一化和QK-范数优化训练稳定性;Gemma 3引入滑动窗口注意力降低计算成本;Llama 4和Qwen3则通过稀疏模型设计提高推理效率。各模型在架构上的细微调整展现了LLM领域的持续优化与创新。

Qwen3-Embedding 全揭秘:从技术到服务,打造高效AI产品的关键路径

Qwen3-Embedding是阿里通义实验室推出的新一代文本嵌入模型,支持多语言和灵活维度定制,在语义搜索、推荐系统等场景表现优异。通过PAI或百炼平台可快速部署,支持微调定制,相比大模型延迟更低、成本更优。实验显示其响应速度达毫秒级,成本仅为LLM的1/4,适合高并发场景。提供缓存、降级等工程优化方案,助力开发者高效构建智能应用。

用Qwen3 Embedding+Milvus,搭建最强企业知识库

阿里低调发布Qwen3-Embedding和Qwen3-Reranker两款新模型,支持119种语言,在多语言任务中表现优异。教程手把手教你用这两款模型搭建RAG系统,通过两阶段检索设计(召回+重排)平衡效率与精度。从环境准备、数据加载到结合重排序技术增强RAG,完整流程清晰易懂,适合开发者快速上手。

ホーム - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-13 05:36
浙ICP备14020137号-1 $お客様$