阿里巴巴的 Kubernetes 应用管理实践经验与教训 作者 | 孙健波(天元) 阿里巴巴技术专家 导读:本文整理自孙健波在 ArchSummit 大会 2019 北京站演讲稿记录。首先介绍了阿里巴巴基于 Kubernetes 项目进行大规模应用实践过程中遇到的问题;随后会逐一介绍解决这些问题的现有实践及其本身存在的局限性;最后会介绍阿里巴巴目前正在进行的尝试和社区在这一领域的发展方向。 如今,阿里巴巴内部维护了数十个大规模的 K8s 集群,其中最大 云计算 2023-07-09 大白菜程序猿
1分钟将你的jenkins构建环境迁移到K8S集群上 资源准备 稳定运行的K8S集群一套(没有可使用Rancher快速部署一个) Jenkins master一台 Jenkins pipeline基础知识:见 链接jenkinspipeline 传统Jenkins使用中暴露的问题 每个业务团队使用的编译环境不统一,需要准备大量的slave节点 Slave很多,空闲期(如夜里)资源浪费 虽然Slave很多,但高峰期队列等待构建任务依然在排队,资源抢 云计算 2023-07-09 张二河
K8S性能问题定位:Airbnb的实践 鉴于现在多个机构开始使用K8S和容器,性能问题成为了管理员的关注焦点,尤其是海量用户使用的互联网公司,比如Airbnb。在2019年北美KubeCon和云原生会议上,来自Airbnb的工程师分享了一些K8S性能方面的实践经验。 Airbnb计算基础设施小组的软件工程师stephen陈和服务编排小组的张jian的分享的主题:K8S让我们的P95变的更糟糕了吗。 他们讨论了他们在使用K8S容器编排引擎 云计算 2023-07-09 大树
直击痛点,详解 K8s 日志采集最佳实践 作者 | 元乙 阿里云存储服务技术专家 导读:上一篇文章主要介绍 Kubernetes 日志输出的一些注意事项,日志输出最终的目的还是做统一的采集和分析。在 Kubernetes 中,日志采集和普通虚拟机的方式有很大不同,相对实现难度和部署代价也略大,但若使用恰当则比传统方式自动化程度更高、运维代价更低。本文为日志系列文章的第 4 篇。 第一篇:《6 个 K8s 日志系统建设中的典型问题,你遇到 云计算 2023-07-09 法医
英国Monzo银行,用K8s管理1600个微服务实践 英国数字银行Monzo两位资深工程师Matt Heath和Suhail Patel在伦敦一场研讨会上,分享了如何管理1600个后端微服务的经验。这间设立超过5年的英国银行,金融用户超过了4百万人,去年9月开始进军美国市场,目前也正在开发企业用的数字银行服务。Monzo所有金融服务都是通过手机App提供,也因此,他们一开始就决定建立分布式架构,而不是建立一套庞大的银行核心系统。最初采用Mesos来建 云计算 2023-07-09 穿过生命散发芬芳
阿里巴巴如何改善开发人员在 K8s 上的体验? 作者:邓洪超 阿里巴巴应用交付专家 前言 通过 K8s,用户能够自定义基础设施,可以平行的替换或改造平台的已有功能,而非只能局限在平台提供的能力之上构建。但正是这样的“白盒化”体验,正在为越来越多的研发和运维带来“太复杂”的困扰。 从 Kubernetes 到“以应用为中心”的美好未来之间,全世界的 PaaS 工程师其实都在期待一项全新的技术能够弥补这之间的鸿沟。阿里云原生应用平台团队的做法是, 云计算 2023-07-09 大猫
Skaffold:让K8S开发工作变得简单 本文介绍在开发过程中,Skaffold自动化build和deploy应用到K8S集群。 Skaffold是由Google发布的命令行工具,专注于促进K8S应用的持续deployment。自动化building和deploying到k8s集群的任务,可以让开发者专注于编写代码。Skaffold是不是很有趣呢,让我们来仔细观察一下吧。 简介 2019年11月份,Skaffold普遍可用的版本发布了,承 云计算 2023-07-09 大白菜程序猿
K8s 从懵圈到熟练集群伸缩原理 作者 | 声东 阿里云技术专家 《深入浅出 Kubernetes》一书共汇集 12 篇技术文章,帮助你一次搞懂 6 个核心原理,吃透基础理论,一次学会 6 个典型问题的华丽操作!以下内容节选自本书: 阿里云 K8s 集群的一个重要特性,是集群的节点可以动态的增加或减少。有了这个特性,集群才能在计算资源不足的情况下扩容新的节点,同时也可以在资源利用率降低的时候,释放节点以节省费用。 这篇文章,我们 云计算 2023-07-09 三掌柜
灵活、高效的云原生集群管理经验:用 K8s 管理 K8s 作者 | 淮右、临石 导读:单 K8s 集群为用户提供了 Namespace 级别的隔离能力,理论上支持不超过 5K Node、15W Pod。多 K8s 集群则解决了单集群的资源隔离、故障隔离难题,打破可支持节点数、Pod 数的限制,但与此同时也带来了集群管理复杂度的上升;尤其在专有云场景中,K8s 工程师不可能像在公有云中一样快速触达客户环境,运维成本被进一步放大。因此如何低成本、高效率、自动 云计算 2023-07-09 宇宙之一粟
万级 K8s 集群背后 etcd 稳定性及性能优化实践 1背景与挑战 随着腾讯自研上云及公有云用户的迅速增长,一方面,腾讯云容器服务TKE服务数量和核数大幅增长, 另一方面我们提供的容器服务类型(TKE托管及独立集群、EKS弹性集群、edge边缘计算集群、mesh服务网格、serverless knative)也越来越丰富。各类容器服务类型背后的核心都是K8s,K8s核心的存储etcd又统一由我们基于K8s构建的etcd平台进行管理。基于它我们目前管理 云计算 2023-07-09 Escape
K8s 边缘节点抓不到监控指标?试试这个方法 KubeSphere v3.1.0 通过集成 KubeEdge,将节点和资源的管理延伸到了边缘,也是 KubeSphere 正式支持边缘计算的第一个版本。 笔者也第一时间搭建和试用了边缘节点相关的功能,但是在边缘节点纳管之后遇到了一些监控的小问题,在排查过程中也顺带了解了一下 KubeSphere 对于边缘节点的监控原理,发出来和大家分享,方便其他的开发者能够更快的排查问题或进行二次开发。 环境版 云计算 2023-07-09 Escape
k8s高可用部署:keepalived + haproxy 最近依照网上不少文章部署K8s高可用集群,遇到了一些麻烦,在这里记录下来。 关键问题 根据K8s官方文档将HA拓扑分为两种,Stacked etcd topology(堆叠ETCD)和External etcd topology(外部ETCD)。 https://kubernetes.cn/docs/setup/production-environment/tools/kubeadm/ha-top 云计算 2023-07-09 三掌柜
k8s高可用部署后续:SLB 前一段时间写了使用keepalived+haproxy部署k8s高可用集群,核心思想是利用keepalived生成vip实现主备容灾,以及haproxy负载k8s-apiserver流量。k8s高可用部署:keepalived + haproxy 这种方式是自己实现了负载均衡。本文将探讨在用户已有SLB的场景下如何实现k8s高可用 SLB概念 阿里云文档中SLB(Server Load Balan 云计算 2023-07-09 大白菜程序猿
为什么要迁移到Kubernetes Kubernetes(或简称K8s)自2015年首次发布以来,随后在GitHub上进行了多次提交,一直在各个行业和专业社区中获得很高的评价。对于软件开发人员,DevOps和数据科学工程师来说,Kubernetes成功背后的原因是显而易见的,那么对于企业管理人员来说并不是那么明显。 因此,本文主要是针对有远见的企业主和高级管理人员,他们希望通过将工作负载迁移到Kubernetes来获得竞争优势。 为 云计算 2023-07-09 泡泡
灵魂拷问:后端业务开发要会用 K8s 到什么程度? 来源 | 阿里巴巴云原生公众号 很多人看着 K8s 成为最热门的开源技术,都纷纷开始学习 K8s,但也有很多人在抱怨 K8s 太复杂了。用 CNCF 新晋 TOC 张磊的话来说:这里的根本问题在于,K8s 的定位是“平台的平台”(The Platform for Platform),所以其核心功能、服务的对象是基础平台工程师,而非业务研发人员与运维人员;它的声明式 API 设计、CRD Opera 云计算 2023-07-09 三掌柜
基于 Kubernetes 的 CI/CD 利器 — Prow 入门指南 Prow是k8s使用的CI/CD系统(https://github.com/kubernetes/test-infra/tree/master/prow),用于管理k8s的issue和pr。如果你经常去k8s社区查看pr或者提交过一些Pr后,就会经常看到一个叫k8s-ci-bot的机器人在各个Pr中回复,并且还能合并pr。在k8s-ci-bot中背后工作的就是Prow。Prow是为了弥补githu 云计算 2023-07-09 泡泡
你真的理解 K8s 中的 requests 和 limits 吗? 在 K8s 集群中部署资源的时候,你是否经常遇到以下情形: 经常在 K8s 集群种部署负载的时候不设置 CPU requests 或将 CPU requests 设置得过低(这样“看上去”就可以在每个节点上容纳更多 Pod )。在业务比较繁忙的时候,节点的 CPU 全负荷运行。业务延迟明显增加,有时甚至机器会莫名其妙地进入 CPU 软死锁等“假死”状态。 类似地,部署负载的时候,不设置内存 req 云计算 2023-07-09 剑圣无痕
Kubernetes 生产环境集群安装实践 作者:张延英,电信系统集成公司山东分公司运维架构师,云原生爱好者,目前专注于云原生运维 前提说明 本系列文档适用于中小规模 (> /etc/fstab 更新操作系统并重启 [root@k8s-master-0 ~]# yum update [root@k8s-master-0 ~]# reboot 安装依赖软件包 [root@k8s-master-0 ~]# yum install soca 云计算 2023-07-09 宇宙之一粟
K8s 安全策略最佳实践 随着 K8s 在生产和测试环境中用的越来越多,对安全性的关注也会越来越多,所以本文主要是给大家分享以下内容: 了解 K8s 环境面临的安全风险 了解 K8s 提供的安全机制 改善 K8s 安全状况的最佳实践 1. K8s 安全风险 这张图是 CNCF 金融用户小组总结的 K8s 信任边界图,它把在 K8s 环境中的信任边界划分成三大块儿。 容器镜像相关部分,主要涉及到的安全攻击点就是镜像仓库和镜像 云计算 2023-07-09 泡泡
KubeSphere 的异地多活方案探索 遇到这样一个场景,在同一套环境中需要存在多个 Host 控制面集群,因此想探索下 KubeSphere 的异地多活混合容器云管理方案。 集群角色介绍 一个兼容原生的 K8s 集群,可通过 ks-installer 来初始化完成安装,成为一个 QKE 集群。QKE 集群分为多种角色,默认是 None 角色(standalone 模式),开启多集群功能时,可以设置为 Host 或者 Member 角色 云计算 2023-07-09 大猫