知鸦日报2025-05-04

2025-05-03 16:30:00 ~ 2025-05-04 16:30:00

テクノロジー

I trained a Language Model to schedule events with GRPO!

摘要

2025年，随着DeepSeek的爆火，GRPO成为训练推理模型的新宠。作者尝试用GRPO训练模型，解决事件调度问题。通过定义任务、生成数据集、设计奖励函数，作者成功训练出一个7B模型，性能甚至超越14B模型。尽管模型在避免事件重叠上仍有不足，但GRPO在可验证任务上展现了巨大潜力，简化了RL流程，凸显了基础模型和奖励函数设计的重要性。

I trained a Language Model to schedule events with GRPO!

一文讲透大数据列存标准格式：Parquet

摘要

验证码将在2秒后刷新，请避免频繁操作以保持页面稳定。

Understanding the Parquet file format

摘要

Apache Parquet是一种高效的列式存储文件格式，广泛应用于Hadoop生态系统。其核心优势在于跨平台、列存储和元数据管理，特别适合大规模数据的高效存储与查询。通过列存储，Parquet在数据压缩和编码上表现出色，如游程编码、字典编码和增量编码，显著减少文件大小。相比CSV和RDS格式，Parquet在文件大小和跨平台兼容性上更具优势，尤其适合处理海量数据。

孪生逆向实战——360相似度验证码

摘要

本文分享了一个基于孪生神经网络的图像识别流程。通过YOLO模型进行目标检测，使用Siamese-pytorch实现图像切割与相似度对比，最终识别出特定字符。整个流程包括图片采集、打标、训练、测试和结果验证，结合AES加密生成轨迹数据。小编总结，此方法简单高效，适合类似场景下的应用。

‹ 2025-05-03 日报 2025-05-05 日报 ›