一文了解 Kubernetes 中的服务发现
Kubernetes 服务发现是一个经常让我产生困惑的主题之一。本文分为两个部分: 网络方面的背景知识 深入了解 Kubernetes 服务发现 要了解服务发现,首先要了解背后的网络知识。这部分内容相对浅显,如果读者熟知这一部分,完全可以跳过,直接阅读服务发现部分。 开始之前还有一个需要提醒的事情就是,为了详细描述这一过程,本文略长。 Kubernetes 网络基础 要开始服务发现的探索之前,需要
Saltstack帮助说明
SaltStack@Master: salt-key -hActions:-l ARG, --list=ARG 显示指定状态的key(支持正则表-L, --list-all 显示所有public keys-a ACCEPT, --accept=ACCEPT 接受指定等待认证的key(-A, --accept-all 接受所有等待认证的key-r REJECT, --reject=REJECT 拒绝
云原生场景下,AIGC 模型服务的工程挑战和应对
作者:徐之浩、车漾 “成本”、“性能”和 “效率”正在成为影响大模型生产和应用的三个核心因素,也是企业基础设施在面临生产、使用大模型时的全新挑战。AI 领域的快速发展不仅需要算法的突破,也需要工程的创新。 大模型推理对基础设施带来更多挑战 首先,AI 商业化的时代,大模型推理训练会被更加广泛的使用。比较理性的看待大模型的话,一个大模型被训练出来后,无外乎两个结果,第一个就是这个大模型没用,那就没有
3个自动伸缩机制,帮你降低Kubernetes的成本
从技术上讲,容器化应该帮助组织更具有成本效益,但Kubernetes到处布满了成本陷阱,可能会使你超出预算。幸运的是,有一些策略可以控制云成本,自动伸缩就是其中之一。Kubernetes带有三个内置的自动伸缩机制来帮助你做到这一点。它们配合得越好,运行应用程序的成本就越低。 1.Pod水平自动扩缩(HPA) Pod 水平自动扩缩(HorizontalpodAutoscaler) 可以基于CPU利用
听GPT 讲Istio源代码pilot(5)
File: istio/pilot/pkg/serviceregistry/kube/controller/ambientindex.go ambientindex.go文件位于istio/pilot/pkg/serviceregistry/kube/controller目录中。它是Istio中Kubernetes服务注册表控制器的一部分,负责维护工作负载和服务之间的索引,以便快速查找和处理网络地