公司:腾讯
腾讯控股有限公司(英语:Tencent Holdings Limited),简称腾讯,是中国一家跨国企业控股公司,为中国大陆规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯滨海大厦。腾讯业务拓展至社交、金融、投资、资讯、工具和平台等不同领域,其子公司专门从事各种全球互联网相关服务和产品、娱乐、人工智能和技术。目前,腾讯拥有中国大陆使用人数最多的社交软件腾讯QQ和微信,以及最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ阅读和微信读书。
腾讯于2004年6月16日在香港交易所挂牌上市,于2016年9月5日首次成为亚洲市值最高的上市公司,并于2017年11月21日成为亚洲首家市值突破5000亿美元的公司。2017年,腾讯首次跻身《财富》杂志世界500强排行榜,以228.7亿美元的营收位居478位。2021年腾讯因财付通业务,也受到了国家金融机构的监管风暴影响,一度被重罚股价大跌,直到2023年整顿完成后才重回世界十大。
香港财经界把阿里巴巴、腾讯、美团点评、小米四只中国大陆科技股的英文名称首个字母,合称“ATMX”股份。
如何在访谈中提升用户投入度
大部分时候,用户参与我们的访谈和测试是一个被动的行为——我们邀请到的用户并不是在产品使用过程中发现了问题想要主动反馈给我们的那些人。被动参与时,用户的积极度、主动性和对访谈主题的准备度都不一定很高,他们可能因为报酬、好奇心等各种原因而来,因此在定性研究类项目中,我们经常会遇到一批用户访谈效果参差不齐的情况。
Elasticsearch核心应用场景-日志优化实践
日志领域是Elasticsearch(ES)最重要也是规模最大的应用场景之一。这得益于 ES 有高性能倒排索引、灵活的 schema、易用的分布式架构,支持高吞吐写入、高性能查询,同时有强大的数据治理生态、端到端的完整解决方案。但原生 ES 在高吞吐写入、低成本存储、高性能查询等方面还有非常大的优化空间,本文重点剖析腾讯云大数据 ES 团队在这三个方面的内核增强优化。
鹅厂专家讲透AI文本生成解码策略与代码实现
本文介绍了几种大型语言模型的不同解码策略,并对它们在不同任务上的表现进行了介绍。其中,Meena和LaMDA采用了sample-and-rank策略,LLaMA使用greedy decoding,GPT-2和GPT-3则采用了greedy decoding和top-p sampling。此外,文章提到了相关参考文献,并为读者提供了一个互动环节,可以在评论区分享自己的学习和疑问。
存储系统中内存索引结构的选择
随着最近几十年来服务器主存容量的增加,即使是大型的事务数据库也能把索引全部放到主存中,当索引数据都在内存中时,索引的性能也就越来越重要。
传统的数据库系统比如mysql一般用B+树作为自己的索引,B+树能够有效减少磁盘IO次数,支持范围查询,但在纯内存环境下,它的性能表现并不太好,特别是B+树是通过key的比较来找节点的,当比较结果产生分支预测失败时,会引起CPU stall。
哈希表是另外一个流行的内存数据结构,和查找树O(logn)的查找时间相比,哈希表只有O(1)的查找时间。尽管如此,哈希表有两个缺陷,一个是哈希表不能支持范围查询,二是哈希表的rehash非常慢可能会造成严重的性能抖动。如果说业务不需要支持范围查询又容量恒定的话,哈希表是最快的索引结构。
第三种数据结构被称为radix tree,或者前缀树,trie等。和二叉树不同,key不会直接保存在节点中,而是由节点在树中的位置决定。radix tree把一个完整的key转变成了字符的序列,每个节点都对应一个特定的字符,每个字符都有可能指向任意一个字符。在radix tree中查找一个key就像查字典一样。从根节点开始每个字符都可以找到一个对应的节点,依次查找key的所有字符就找到了key对应的叶子结点。
Apache Flink 在微信业务场景下的内核及应用优化
随着微信业务的飞速发展,大数据应用已经全面走向实时化,业务对流计算引擎的稳定性及性能有更高的要求。微信基于 Flink on K8S 深入打造了云原生、高性能、稳定可靠的实时计算平台,支撑了微信各业务的快速发展。
微信海量数据查询如何从1000ms降到100ms?
微信业务解析,鹅厂团队是如何突破瓶颈的?
MySQL的字符集实现
我们以5.7.36版本作为演示版本,探索一下MySQL内部字符集的实现,以此来从内部的视角来看看神秘的MySQL字符集是如何实现的。
我用低代码结合ChatGPT开发,每天多出1小时摸鱼
GPT 出现之后,很多人推测大量的软件都会因为其出现而重写。本文主要是低代码平台与 ChatGPT 结合的一些思考以及实践。
手把手教你用Stable Diffusion写好提示词
Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度,文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好。本文从“如何写好提示词”出发,从提示词构成、调整规则和 chatGPT 辅助工具等角度,对文生图的提示词输入进行归纳总结。
QQGC?揭秘QQ的AI绘画大模型技术
2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文作者富宸、王锐将介绍在QQGC基础大模型训练中的实践和探索。
AI换脸10分钟诈骗430万,黑产诈骗怎么防
随着 ChatGPT、Midjourney、Stable Diffusion 等现象级应用的广泛使用,大模型的安全性受到了学术界和产业界的广泛关注。现有的研究热点主要围绕两方面:
(1)利用 SFT 与 RLHF 等技术将大模型与人类偏好对齐,从而提升大模型自身的安全性。
(2)针对不同场景设计专用内容过滤器。除了大模型服务系统自身的安全性之外,如何防止大模型引发其他类型的风险也是值得注意的方向,本研究全面地讨论了大模型对于现有数字黑灰色产业的革新以及如何利用大模型自身的能力构建下一代的风控系统,针对一些具体的案例,我们给出了详细的上下游作恶手法还原,以此警示大家注意防范生成式 AI 引发的新型风险。
本文由 AI lab,SSV 公益平台部,PCG 画像平台中心,三方合作完成,旨在吸引对于 AIGC 在风控场景引发的风险的重视及提出一些解决思路。
鹅厂程序员的9个生存法则
从代码技巧、设计模式、高可用架构到职场发展。
WeOLAP 亚秒级实时数仓 —— BitBooster 10倍查询优化实践
推荐系统对“个性化体验”的强烈诉求,推动了“亚秒级”分析系统的诞生。微信大数据平台基于ClickHouse内核打造了WeOLAP亚秒级查询引擎,本文介绍系列性能优化之BitBooster。
通俗直观介绍ChatGPT背后的大语言模型理论知识
“AI 的 iPhone 时刻到来了”。非算法岗位的研发同学'被迫'学习 AI,产品岗位的同学希望了解 AI。但是,很多自媒体文章要么太严谨、科学,让非科班出身的同学读不懂;要么,写成了科幻文章,很多结论都没有充分的逻辑支撑,是‘滑坡推理’的产物。这篇文章从底层讲起,却不引入太多概念,特别是数学概念,让所有人都能对大模型的核心概念、核心问题建立认知。文章末尾也为需要严肃全面地学习深度学习的人给出了建议。
国民游戏王者荣耀的真实地图开发之路
王者荣耀的地图是怎样开发出来的?
Apache Pulsar在微信实时推荐场景下的优化与实践
Pulsar 作为微信大数据平台 Gemini-2.0 的消息队列,支持了微信实时大数据及推荐场景的业务。经过我们一系列的改造优化,Pulsar在高性能、高可用、易维护、低成本等方面,都有很大的提升。