知鸦日报2025-10-08

2025-10-07 16:30:00 ~ 2025-10-08 16:30:00

Technologie

What GPT-oss Leaks About OpenAI's Training Data

摘要

OpenAI的GPT-5模型存在训练数据泄露问题,部分语料来自成人网站和垃圾信息。通过对模型权重的分析,发现了一些异常的高频词汇,揭示了训练数据的潜在来源。这些“故障词汇”不仅暴露了模型的训练细节,还暗示了数据采集范围的广泛性,甚至包括GitHub等平台。这表明开源模型可能带来新的安全风险,建议前沿实验室优化词汇表,减少不常见字符串的纳入。

登录后可查看文章图片

领域大模型的挑战与机遇:从构建到应用

摘要

大模型在专业领域的深度思维能力面临三大挑战:复杂指令执行的不稳定性、专家思维模式的缺失及工具调用的被动性。通过强化学习驱动的思维链构建和结构化专家思维注入,大模型有望从“知性智能”向“理性智能”跨越。工具调用与深度思维的融合,进一步提升了模型的实践能力,为行业应用提供了新的解决方案。


‹ 2025-10-07 日报 2025-10-09 日报 ›

qrcode

关注公众号
接收推送