话题AIGC产品 › DeepSeek

AIGC产品:DeepSeek

关联话题: 深度求索

DeepSeek(深度求索)是一家专注实现AGI(通用人工智能)的中国科技公司,成立于2023年,总部位于杭州。

DeepSeek爆火,但被AI抛弃的人,无人关心

韩束母公司上美股份创始人吕义雄在工作群中讨论用AI替代员工,引发热议。AI技术导致全球范围内许多岗位被替代,尤其是客服和程序员等职业。尽管技术变革创造了新岗位,但速度和技能要求使得许多被替代员工难以适应。AI的快速发展对社会弱势群体构成挑战,需关注其体面生活。技术进步不可阻挡,但应兼顾人性化关怀。

Deepseek本地部署详细指南!从 Ollama 到个人知识库应用

Ollama提供跨平台安装指南,支持macOS、Windows和Linux,帮助用户轻松运行本地AI模型。通过下载和加载Deepseek模型,用户可以在终端进行模型对话。硬件建议配置为32GB内存和16GB显存。安装交互UI的Chatbox和Page Assist插件,用户可以实现智能问答模式。Dify知识库搭建指南提供了详细步骤,支持Docker Compose部署,并通过Ollama实现模型供应。14b模型在翻译任务中表现优于7b模型,适用于macOS的特定业务场景。

飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了

最近,DeepSeek-R1 因用户需求过大导致服务器繁忙,推动了多种应用和服务接入该模型。飞书已实现 DeepSeek-R1 的集成,使用户能在多维表格中直接输入提示词,自动批量处理任务,免去复杂的 API 调整。用户分享了在飞书中使用 DeepSeek-R1 的成功案例,展现了其在写作、问题解答等方面的强大能力。飞书的并行处理提升了效率,进一步凸显了其在 AI 集成方面的优势。

Understanding Reasoning LLMs

文章探讨了如何增强大型语言模型(LLM)的推理能力,介绍了四种主要的方法:推理时扩展、纯强化学习、监督微调加强化学习,以及模型蒸馏。DeepSeek-R1模型展示了通过纯强化学习实现推理能力的可能性,并通过监督微调和强化学习进一步提升性能。文章还讨论了更小、更高效模型的开发,如通过蒸馏方法实现的R1-distilled模型,以及预算有限下的推理模型开发策略。

漫谈DeepSeek及其背后的核心技术

DeepSeek公司成立于杭州,以低成本和高性能的大模型DeepSeek-V3引领行业。其创新技术包括MLA多头潜在注意力、FP8混合精度训练和MoE架构,有效提升训练和推理效率。采用HAI-LLM训练框架和DualPipe并行算法,优化通信与计算重叠,显著降低成本。V3模型已达到国际领先水平,在国内外应用广泛。DeepSeek的成功展示了中国在AI基础技术研发中的突破,促进AI行业更快速、低成本迭代。

十大神级提示词让你的DeepSeek秒变最强助手~智能水平提升300%!

DeepSeek AI提供十大实用提示词技巧,帮助用户在不同场景中最大化AI效能。包括智囊团模式、多角度分析问题;毒舌模式,轻松幽默吐槽;未来预测和商业预言家模式,从趋势到决策提供全方位支持;挑刺达人严格审核方案;文艺编程带来诗意代码;大白话模式简化专业术语;变脸大师模仿风格;老板视角提前演练高管汇报;干货模式直击关键建议。这些技巧让人机交互高效又有趣。

DeepSeek启示录!

DeepSeek-R1的推出为中文大语言模型带来了强大推理能力、高性能、原生中文训练以及低成本优势。未来,企业将整合数据库和大语言模型,形成新的数智库,推动管理系统和组织结构变革。AI辅助编程将重塑软件开发流程,企业需构建新组织形式以适应AI时代,其中需求工程和价值量化将成为关键。通过知识管理系统,AI将优化人力资源配置,助力企业实现智能化转型。

DeepSeek-R1 是怎么训练的

DeepSeek-R1模型开源,引发中美互联网热议。R1性能媲美OpenAI o1,价格却低廉。其训练结合了冷启动微调和强化学习,强化学习的有效性在R1-Zero中得到验证。通过蒸馏技术,R1的推理能力可传递至小型模型。尽管R1在通用能力和语言处理上有待提升,但其在数学、代码和推理任务上表现出色,未来将继续优化和扩展应用领域。

DeepSeek-V3 是怎么训练的

DeepSeek-V3 以约550万美元成本开源,性能媲美Claude 3.5。在MATH 500、AIME 2024等高级数学测试中表现尤为突出,采用MLA、DeepSeekMoE架构和创新负载均衡策略,在显存和计算开销上实现优化。工程优化包括DualPipe流水线并行、通信优化、内存管理和FP8低精度训练。预训练覆盖广泛数据集,并通过两阶段策略扩展上下文长度。后训练阶段结合有监督微调和强化学习,提升模型对齐人类偏好的能力。

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.142.0. UTC+08:00, 2025-02-23 18:47
浙ICP备14020137号-1 $访客地图$