公司:七猫
七猫是一家深耕文化娱乐行业的互联网企业。
提升自然语言转换为 SQL 查询(NL2SQL)准确度的探索-- LLaMA-Factory 蒸馏 DeepSeek 模型的方法介绍
探索通过模型蒸馏提升NL2SQL准确度,采用DeepSeek-R1-Distill-Qwen-7B模型在Spider数据集上进行训练和蒸馏,对比满血版DeepSeek模型,发现蒸馏模型在特定语言环境下表现更优。本地蒸馏技术可行,未来可通过更大显存环境和建设元数据知识库进一步提升准确度。
Ants源码分析
Ants协程池采用惰性创建策略,通过WorkerQueue管理协程,支持循环队列和栈两种实现。任务提交时,Ants利用自旋锁和条件变量确保高效调度,空闲协程通过守护协程定期清理。Ants还支持动态调整协程池容量和预热协程,优化冷启动性能。整体设计注重内存复用和调度效率,适用于高并发场景。
StarRocks 在七猫的应用(四)-探索 StarRocks 读取 Paimon 优势及物化视图加速能力
面对海量小说数据,StarRocks通过直接查询、Data Cache和异步物化视图,显著提升查询效率。其Catalog功能简化了Paimon数据湖的管理,支持多元数据融合分析,助力精准推荐和内容创作。未来,StarRocks将优化元数据管理、执行计划和物化视图,进一步强化实时数据处理能力,推动公司业务发展。
探索AI工具幕后,打造你自己的Agent应用
本文教你制作一个智能命令行工具Commander,通过感知、决策、行动和目标导向,模拟自主AI助手。使用OpenAI风格的API调用模型,借助LangChain框架实现AI的推理和执行。文章详细介绍了如何让AI理解并执行命令,包括结构化输出和函数调用等技术。还探讨了记忆、知识库和微调等高级功能,帮助你构建更智能的AI应用。
StarRocks 在七猫的应用(三)-实时数据写入与查询性能优化
StarRocks在实时数据处理中表现出色,通过Delete & Insert模式、CBO优化器和向量化执行引擎,显著提升了数据导入和查询性能。开发流程简化,数据准确性高,运维便捷。针对复杂查询,使用物化视图和二级分区策略,进一步优化了查询效率,大幅减少了数据扫描量,提升了查询速度。
华为ArkUI-X跨平台技术探索
本文讨论了华为 ArkUI-X 跨平台技术,包括背景、开发环境搭建、创建跨平台工程、图片浏览功能案例、跨端技术、面临问题及总结等方面内容。
基于沉浸度模型预估的广告动态展示
本文主要介绍我们在用户侧建模的首次探索和实践。经过实验分析,取得了初步的结果,在核心指标人均阅读时长、DAU上带来了显著的提升,验证了整个方向的可迭代性。
AIGC业务平台
AIGC平台融合前沿的人工智能技术,包括但不限于生文大模型、生图及视频模型,致力于构建一个高效稳定的AIGC工作流程。我们的目标是通过这些技术提升内容生产的效率,同时降低成本,为业务场景提供强有力的支持。
Go1.23 糖果 —— iter 迭代器
@李天鸣:本文介绍了 Go 1.23 引入的 iter 迭代器,然后通过案例展示了基础的使用以及函数式的方式,最后简述了实现原理与两种迭代模式。从代码的可读性来看,迭代器增加了代码的理解成本。不过从“对象”的角度来分析,迭代器其实有助于代码封装维护,因为它将分散的逻辑内聚到一起,并且提供了统一的消费模式。
基于 Pyroscope 的 PGO 最佳实践
性能监控与优化是现代软件开发中后台的一环,尤其是在循环系统和服务端应用中。通过有效的性能监控工具,开发者能够快速定位并解决性能瓶颈,从而提升系统的响应速度和用户体验。继《使用 Pyrscope 结合 Holmes 加速找到服务瓶颈》之后,Pyrscope 在我们的团队中发挥了重要作用。例如,相关服务中,对深复制操作的优化,实现了性能提升…
七猫自研机器学习平台
七猫小说APP内容推荐的精准度,依赖策略算法的持续迭代,预估模型是算法的核心能力。此前,七猫各项推荐业务接入模型需要一定的学习成本,且各项业务模型独立开发,不同业务间的模型能力不能快速协作和复用,无法形成合力,造成一定的人力浪费。针对这些痛点,我们基于开源框架,自主建设了一个机器学习平台,从特征、训练、部署等方面简化模型接入流程,将通用的数据、基建进行统一,提升模块的复用能力,减少重复开发和人力…
全托管 StarRocks 在七猫的应用和实践
现在七猫有多套全托管 StarRocks 集群在生产环境投入了使用,部分 StarRocks 集群从 EMR StarRocks 集群逐步升级成为全托管 StarRocks 集群。据不完全统计,数据治理前离线数据加实时数据,总数据量大约在 20PB 左右。
Java+MotionEvent实现埋点自动化
本文旨在帮助测试人员“0”代码完成UI自动操作以及埋点自动校验,基于现状,埋点测试以及每次发版需要花费大量时间验证相关埋点,并且随着业务发展,埋点数量只会越来越多,很难做到每次发版将全部埋点回归验证一遍,虽然线上有埋点数据监控系统,但是发现埋点数据异常时已处于外网阶段,因此需要一套机制降低埋点问题逃逸率,同时降低测试负担,提高测试效率。
读懂前端「性能优化」
HTTP/2引入了HPACK来压缩头信息,提高传输速度。在Nginx和Node服务端配置gzip压缩,使用Webpack插件对JavaScript、CSS、HTML进行压缩,以减小文件大小。此外,还可以采用代码优化措施,如减少全局变量的使用、避免频繁的DOM操作、使用事件缓存、使用节流和防抖函数来提高JavaScript性能。选择合适的数据结构以及避免使用eval()函数和不必要的递归也是优化JavaScript性能的方法。
七猫日志接收系统之客户端埋点 SDK
七猫日志接收系统系列文章将会向大家介绍七猫日志接收系统及相关的埋点 SDK,总共分为四篇, 本文为系列的第三篇,将介绍客户端埋点 SDK 的实现,主要涵盖了埋点日志的采集、存储、上传等一系列流程。
七猫日志接收系统之架构设计(下)
七猫日志接收系统系列文章将会向大家介绍七猫日志接收系统及相关的埋点 SDK,总共分为四篇。本文为系列的第二篇,我们将基于当前的 v4 版本详细介绍七猫日志接收系统架构,并从日志处理效率、系统的高可用以及成本控制等方面进行架构设计分析。同时随着七猫的继续壮大,日志接收系统必将迎来越来越多的挑战,我们也会对后续的迭代版本进行规划与展望。