虚拟机与容器:Kubernetes
微店算法平台在kubernetes上的实践探索
本文主要介绍微店通过容器技术搭建机器学习平台的演进过程,特别是离线模型训练任务流程和模型预测在线服务等核心部分的架构设计经验。
Flink on K8S 在网易传媒的落地实践
分享网易传媒在 Flink on K8S 落地过程中关键问题的解决方案和自研实时计算平台 Riverrun 的特色建设。
云原生安全-从k8s日志审计视角检测自动化工具攻击
随着云原生技术的普及,其暴露出来的攻击面也被黑客们念念不忘,相关的攻击技术也跟着被“普及”,自动化漏洞利用攻击工具更是如雨后春笋般出现在GitHub开源平台,其中比较有代表性的如cdk-team/CDK。
Kubernetes弹性扩缩容之HPA和KEDA
传统意义上说,弹性伸缩主要解决的问题是容量规划与实际负载的矛盾。而云计算为云原生中提供的优势之一就是弹性能力,从Kubernetes实战出发,不管是在业务稳定性保障还是成本治理角度,弹性扩缩容能力都是必要研究方向。
破茧成蝶 - Serverless Kubernetes 的思考与征程(二)
本文主要针对 Serverless Container 技术的特殊性,分享其对 Kubernetes 的架构影响,以及阿里云在Serverless Kubernetes方面架构选择。
K8S学习之当我们部署应用的时候都发生了什么?
本文在大的框架上记录了K8S的架构与原理。
字节跳动高性能 Kubernetes 元信息存储方案探索与实践
KubeBrain 是字节跳动针对 Kubernetes 元信息存储的使用需求,基于分布式 KV 存储引擎设计并实现的、可以取代 etcd 的元信息存储系统,目前支撑着线上超过 20,000 节点的超大规模 Kubernetes 集群的稳定运行。
一文详解K8s环境下Job类日志采集方案
本文将基于高性能轻量级可观测采集器iLogtail探讨Job日志的多种采集方案,分析这些方案在不同场景下对日志采集所能做到稳定性保证以及方案优化空间。
哈啰Kubernetes基于水位的自定义调度器落地之路
本篇文章以理论+线上实践的方式详细介绍下哈啰基于水位自定义调度器的落地过程。
Kubernetes HPA一定会减少资源使用吗?HPA可观测性实践分享!
Kubernetes HPA一定会减少资源使用吗?HPA可观测性实践分享。
Kubernetes 资源拓扑感知调度优化
近年来,随着腾讯内部自研上云项目的不断发展,越来越多的业务开始使用云原生方式托管自己的工作负载,容器平台的规模因此不断增大。以 Kubernetes 为底座的云原生技术极大推动了云原生领域的发展,已然成为各大容器平台事实上的技术标准。在云原生场景下,为了最大化实现资源共享,单台宿主机往往会运行多个不同用户的计算任务。如果在宿主机内没有进行精细化的资源隔离,在业务负载高峰时间段,多个容器往往会对资源产生激烈的竞争,可能导致程序性能的急剧下降,主要体现为:
- 资源调度时频繁的上下文切换时间
- 频繁的进程切换导致的 CPU 高速缓存失效
因此,在云原生场景下需要针对容器资源分配加以精细化的限制,确保在 CPU 利用率较高时,各容器之间不会产生激烈竞争从而引起性能下降。
vivo大规模 Kubernetes 集群自动化运维实践
随着vivo业务迁移到k8s的增长,我们需要将k8s部署到多个数据中心。如何高效、可靠的在数据中心管理多个大规模的k8s集群是我们面临的关键挑战。
Dynamic Kubernetes Cluster Scaling at Airbnb
An important part of running Airbnb’s infrastructure is ensuring our cloud spending automatically scales with demand, both up and down. Our traffic fluctuates heavily every day, and our cloud footprint should scale dynamically to support this.
To support this scaling, Airbnb utilizes Kubernetes, an open source container orchestration system. We also utilize OneTouch, a service configuration interface built on top of Kubernetes, and is described in more detail in a previous post.
In this post, we’ll talk about how we dynamically size our clusters using the Kubernetes Cluster Autoscaler, and highlight functionality we’ve contributed to the sig-autoscaling community. These improvements add customizability and flexibility to meet Airbnb’s unique business requirements.
How LyftLearn Democratizes Distributed Compute through Kubernetes Spark and Fugue
In a previous blog post, we discussed LyftLearn’s infrastructure built on top of Kubernetes. In this post, we will focus on the compute layer of LyftLearn, and will discuss how LyftLearn solves some of the major pain points faced by Lyft’s machine learning practitioners.
HPA-提升k8s集群资源利用率实践
应用的资源使用率通常都有高峰和低谷的时候,如何削峰填谷,提高集群的整体资源利用率,让应用中的Pod个数自动调整呢?这就有赖于Horizontal Pod Autoscaling了,顾名思义,使Pod水平自动缩放。
Cisco Nexus L2 Switch 进行 vPC 和 L3 改造以支持 K8S 部署
详细介绍了 Cisco Nexus L2 交换机进行 vPC 后 L3 改造的方案~