话题AI产品 › Qwen

AI产品:Qwen

关联话题: 通义千问

GELab-Zero 技术解析:当豆包联手中兴,开源界如何守住端侧 AI 的“最后防线”?

2025年12月,AI端侧领域迎来两大突破:字节跳动豆包团队发布豆包手机助手,实现本地记忆与跨应用操作;阶跃星辰开源GELab-Zero-4B模型,推动4B参数模型在安卓设备上轻量化部署。GELab-Zero采用GUI视觉方案,通用兼容且隐私安全,解决了移动端Agent落地的核心挑战,展现了强大的多模态推理能力与工程化设计。

高德生成式推荐大模型|用技术预估你接下来想做什么

高德地图推出G-Action生成式行为推荐框架,通过AI大模型预测用户出行意图。该技术结合时空、天气等实时数据,用自然语言理解用户行为流,精准推荐"动作+地点"组合。相比传统推荐,模型在Action预测准确率提升8.1%,并实现语义连贯的个性化推荐,如自动关联"导航-团购-评价"行为链。目前已在到店卡等场景取得显著效果,未来将持续优化多目标预估能力。

SpecKit 在成熟 Java 项目中的 AI 编码实践

AI Code与SpecKit结合,助力Java应用开发。SpecKit遵循SDD与TDD理念,通过结构化规范拆解开发流程,提升代码一致性、可维护性。实践表明,AI Coding在单兵作战中效率显著,但在成熟应用中需注意前后端协作与长期维护。选型上,cursor + claude 4.5组合表现优异,而idea + qwen code cli + qwen3 coder plus则适合高安全需求。开发过程中,SpecKit的步骤命令与过程命令有效辅助规范执行与细节调整。AI Coding推动开发流程标准化,未来需加强全局知识检索能力。

2025必看系列:AI如何重新定义研究?万字长文讲透Deep Research

AI研究新范式Deep Research崛起!从RAG到深度研究,AI正从被动检索升级为主动探索。四大核心模块——规划、问题演化、网页探索、报告生成——让AI像专家般拆解复杂任务。主流系统虽强,但数据单一性仍是痛点。腾讯Dola创新融合公私域数据,让分析更精准。这波AI进化浪潮,正在重塑研究方式!

基于大模型增强的少样本学习在用户投诉意图感知中的应用

5G时代网络投诉处理面临少样本识别难题,传统小模型泛化能力不足,大模型又缺乏领域知识。创新方案来了!通过大模型生成高质量模拟样本,结合小模型反馈迭代优化,成功提升少样本投诉识别准确率21%,整体提升9%。实验证明,这种大小模型协同的增强学习框架既实用又高效,为通信领域智能化运维提供了新思路。

AICoding实践:从Prd到代码生成

AI编程系统CodeFuse正推动软件工程向"需求驱动型"变革,实现从自然语言需求到代码的端到端自动生成。面对复杂代码资产和业务理解难题,通过构建标准化Workflow、RAG检索和知识图谱增强上下文理解,结合分层生码与自动Review确保代码质量。目前安全域AI生成代码占比已达43%,在审理平台等场景实现单需求2万行代码生成,未来将持续强化技术风险防控与数据沉淀能力。

Evolution and Scale of Uber’s Delivery Search Platform

Uber Eats通过语义搜索提升用户体验,采用双塔模型和Qwen大语言模型,实现跨语言、跨领域的精准匹配。系统利用MRL技术优化嵌入维度,结合ANN索引和量化策略,平衡检索质量与计算成本。通过蓝绿部署和自动化验证,确保模型更新不中断服务,每两周刷新索引保持数据实时性,最终实现高效、低延迟的全球搜索系统。

C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审

在C3级代码仓库中,团队通过Qwen3-Coder、RAG和Iflow实现了LLM代码评审的自动化实践。结合百炼Embedding构建知识索引,AI在CI流水线中自动触发评审,识别并发缺陷、资源泄漏等问题,显著提升评审效率与质量。AI评审已成功拦截多次高危缺陷,展现出与传统人工评审互补的优势,并在持续优化中探索修复建议生成。

不只是写代码:Qwen Code 如何规划、执行并验证软件工程任务

阿里推出的CLI工具Qwen Code,通过精细化Prompt设计,赋予大模型自主规划、编码、测试与验证能力。Qwen Code基于Qwen3-Coder模型,支持任务管理、工具调用和多步决策循环,显著提升开发效率与代码质量。其核心功能包括内置工具、任务跟踪与智能辅助决策,助力开发者从繁琐工作中解放,专注于创造性工作。

Qwen3 x ms-swift:监督微调在居住服务行业的一次实践

大模型微调在租房平台意图识别场景中展现显著优势,通过Qwen3-8B模型微调,准确率提升至94.5%,远超传统方法。微调不仅优化了模型性能,还降低了延迟,满足了实时交互需求。数据质量和多样性是微调成功的关键,少量高质量数据也能带来显著效果。ms-swift框架简化了训练流程,支持多尺寸模型微调,为业务提供了高效、低成本的解决方案。

主流大模型架构深度对比,涵盖 Llama、Qwen、DeepSeek 等六大模型

本文对比了2025年主流大型语言模型(LLM)的架构演进,重点分析了DeepSeek V3、OLMo 2、Gemma 3、Llama 4、Qwen3等模型的技术创新。DeepSeek V3采用多头潜在注意力和专家混合提升效率;OLMo 2通过后归一化和QK-范数优化训练稳定性;Gemma 3引入滑动窗口注意力降低计算成本;Llama 4和Qwen3则通过稀疏模型设计提高推理效率。各模型在架构上的细微调整展现了LLM领域的持续优化与创新。

Qwen3-Embedding 全揭秘:从技术到服务,打造高效AI产品的关键路径

Qwen3-Embedding是阿里通义实验室推出的新一代文本嵌入模型,支持多语言和灵活维度定制,在语义搜索、推荐系统等场景表现优异。通过PAI或百炼平台可快速部署,支持微调定制,相比大模型延迟更低、成本更优。实验显示其响应速度达毫秒级,成本仅为LLM的1/4,适合高并发场景。提供缓存、降级等工程优化方案,助力开发者高效构建智能应用。

用Qwen3 Embedding+Milvus,搭建最强企业知识库

阿里低调发布Qwen3-Embedding和Qwen3-Reranker两款新模型,支持119种语言,在多语言任务中表现优异。教程手把手教你用这两款模型搭建RAG系统,通过两阶段检索设计(召回+重排)平衡效率与精度。从环境准备、数据加载到结合重排序技术增强RAG,完整流程清晰易懂,适合开发者快速上手。

多快好省,Qwen3混合部署模式引爆MCP

MCP(Model Context Protocol)通过Host、Client、Server三个核心组件,实现AI与外部工具和数据源的灵活交互。Claude模型通过prompt智能选择工具,执行后反馈结果生成最终回应。Qwen3采用混合专家架构,支持119种语言,性能大幅提升,部署成本降低,提供多种模型版本,适用于不同场景。通过MCP,用户可轻松调用现成工具,开发者则能快速构建自定义服务器。

自媒体创作场景实践|通义千问3 + MCP=一切皆有可能

本文介绍了如何通过MCP协议接入Qwen3-235B-A22B大模型,结合ComfyUI实现AI云服务的数据互通。方案展示了从本地读取prompt生成图片,并自动发布到小红书的全流程。MCP的扩展性和易用性使其在AI场景中具有广泛的应用潜力,如订单管理、具身智能等。尽管存在模型智能度和安全风险等挑战,MCP的未来发展前景依然广阔。

A Step-by-Step Guide to Creating a Custom Vision-Language Dataset for Fine-Tuning Qwen-2-VL with LLaMA-Factory

本文将指导如何为Qwen-2-VL视觉语言模型创建定制数据集,并使用LLaMA-Factory进行微调。首先,准备合同文档图片并生成问答对,利用GPT-4模型自动生成问题与答案。接着,将数据集上传至Hugging Face Hub,最后配置并运行微调脚本。该流程适用于文档视觉问答等任务,帮助构建专用模型,提升性能。

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-17 02:39
浙ICP备14020137号-1 $访客地图$