公司:腾讯
腾讯控股有限公司(英语:Tencent Holdings Limited),简称腾讯,是中国一家跨国企业控股公司,为中国大陆规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯滨海大厦。腾讯业务拓展至社交、金融、投资、资讯、工具和平台等不同领域,其子公司专门从事各种全球互联网相关服务和产品、娱乐、人工智能和技术。目前,腾讯拥有中国大陆使用人数最多的社交软件腾讯QQ和微信,以及最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ阅读和微信读书。
腾讯于2004年6月16日在香港交易所挂牌上市,于2016年9月5日首次成为亚洲市值最高的上市公司,并于2017年11月21日成为亚洲首家市值突破5000亿美元的公司。2017年,腾讯首次跻身《财富》杂志世界500强排行榜,以228.7亿美元的营收位居478位。2021年腾讯因财付通业务,也受到了国家金融机构的监管风暴影响,一度被重罚股价大跌,直到2023年整顿完成后才重回世界十大。
香港财经界把阿里巴巴、腾讯、美团点评、小米四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
如何设计一个海量任务调度系统
搭建一套通用的分布式任务调度平台。
不写代码也能年薪百万?Prompt+低代码开发实战
鹅厂前端大牛聊 Prompt 工程与低代码开发。
一文入门数据产品
看到不少同学咨询如何入门数据产品,例如数据产品入门应该学什么、解决什么问题、发展方向如何等。作为专职从事数据产品岗位快三年的同学,对上述问题感同身受。
本文从内容型或业务型数据产品实践的角度浅谈下数据产品岗位能力模型、进阶难点、进阶技巧,希望能对有相同疑惑的同学提供一个视角。
WeKB on Plato:微信知识图谱表示学习实践
知识图谱作为一种存储事实信息的结构,能够为推荐等场景提供有效的域外信息辅助。基于此,微信图计算框架Plato与微信知识图谱WeKB共同研发了图谱表示学习模型TransE+,在链接预测任务上相较最强基线取得显著效果,并在业务场景探索落地。
如何在访谈中提升用户投入度
大部分时候,用户参与我们的访谈和测试是一个被动的行为——我们邀请到的用户并不是在产品使用过程中发现了问题想要主动反馈给我们的那些人。被动参与时,用户的积极度、主动性和对访谈主题的准备度都不一定很高,他们可能因为报酬、好奇心等各种原因而来,因此在定性研究类项目中,我们经常会遇到一批用户访谈效果参差不齐的情况。
Elasticsearch核心应用场景-日志优化实践
日志领域是Elasticsearch(ES)最重要也是规模最大的应用场景之一。这得益于 ES 有高性能倒排索引、灵活的 schema、易用的分布式架构,支持高吞吐写入、高性能查询,同时有强大的数据治理生态、端到端的完整解决方案。但原生 ES 在高吞吐写入、低成本存储、高性能查询等方面还有非常大的优化空间,本文重点剖析腾讯云大数据 ES 团队在这三个方面的内核增强优化。
鹅厂专家讲透AI文本生成解码策略与代码实现
本文介绍了几种大型语言模型的不同解码策略,并对它们在不同任务上的表现进行了介绍。其中,Meena和LaMDA采用了sample-and-rank策略,LLaMA使用greedy decoding,GPT-2和GPT-3则采用了greedy decoding和top-p sampling。此外,文章提到了相关参考文献,并为读者提供了一个互动环节,可以在评论区分享自己的学习和疑问。
存储系统中内存索引结构的选择
随着最近几十年来服务器主存容量的增加,即使是大型的事务数据库也能把索引全部放到主存中,当索引数据都在内存中时,索引的性能也就越来越重要。
传统的数据库系统比如mysql一般用B+树作为自己的索引,B+树能够有效减少磁盘IO次数,支持范围查询,但在纯内存环境下,它的性能表现并不太好,特别是B+树是通过key的比较来找节点的,当比较结果产生分支预测失败时,会引起CPU stall。
哈希表是另外一个流行的内存数据结构,和查找树O(logn)的查找时间相比,哈希表只有O(1)的查找时间。尽管如此,哈希表有两个缺陷,一个是哈希表不能支持范围查询,二是哈希表的rehash非常慢可能会造成严重的性能抖动。如果说业务不需要支持范围查询又容量恒定的话,哈希表是最快的索引结构。
第三种数据结构被称为radix tree,或者前缀树,trie等。和二叉树不同,key不会直接保存在节点中,而是由节点在树中的位置决定。radix tree把一个完整的key转变成了字符的序列,每个节点都对应一个特定的字符,每个字符都有可能指向任意一个字符。在radix tree中查找一个key就像查字典一样。从根节点开始每个字符都可以找到一个对应的节点,依次查找key的所有字符就找到了key对应的叶子结点。
Apache Flink 在微信业务场景下的内核及应用优化
随着微信业务的飞速发展,大数据应用已经全面走向实时化,业务对流计算引擎的稳定性及性能有更高的要求。微信基于 Flink on K8S 深入打造了云原生、高性能、稳定可靠的实时计算平台,支撑了微信各业务的快速发展。
微信海量数据查询如何从1000ms降到100ms?
微信业务解析,鹅厂团队是如何突破瓶颈的?
MySQL的字符集实现
我们以5.7.36版本作为演示版本,探索一下MySQL内部字符集的实现,以此来从内部的视角来看看神秘的MySQL字符集是如何实现的。
我用低代码结合ChatGPT开发,每天多出1小时摸鱼
GPT 出现之后,很多人推测大量的软件都会因为其出现而重写。本文主要是低代码平台与 ChatGPT 结合的一些思考以及实践。
手把手教你用Stable Diffusion写好提示词
Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度,文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好。本文从“如何写好提示词”出发,从提示词构成、调整规则和 chatGPT 辅助工具等角度,对文生图的提示词输入进行归纳总结。
QQGC?揭秘QQ的AI绘画大模型技术
2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文作者富宸、王锐将介绍在QQGC基础大模型训练中的实践和探索。
AI换脸10分钟诈骗430万,黑产诈骗怎么防
随着 ChatGPT、Midjourney、Stable Diffusion 等现象级应用的广泛使用,大模型的安全性受到了学术界和产业界的广泛关注。现有的研究热点主要围绕两方面:
(1)利用 SFT 与 RLHF 等技术将大模型与人类偏好对齐,从而提升大模型自身的安全性。
(2)针对不同场景设计专用内容过滤器。除了大模型服务系统自身的安全性之外,如何防止大模型引发其他类型的风险也是值得注意的方向,本研究全面地讨论了大模型对于现有数字黑灰色产业的革新以及如何利用大模型自身的能力构建下一代的风控系统,针对一些具体的案例,我们给出了详细的上下游作恶手法还原,以此警示大家注意防范生成式 AI 引发的新型风险。
本文由 AI lab,SSV 公益平台部,PCG 画像平台中心,三方合作完成,旨在吸引对于 AIGC 在风控场景引发的风险的重视及提出一些解决思路。
鹅厂程序员的9个生存法则
从代码技巧、设计模式、高可用架构到职场发展。