云计算-每日运维网

减少文件体积，你的姿势对了吗？

嘿，如果你觉得减少文件体积就像找到一种数字瑜伽姿势一样简单，那可就有点“天真”。优化文件体积需要仔细理想与现实的搭配。这可是一门数字艺术，要找到最佳平衡点。所以，让我们一同探讨：减少文件体积的姿势，你的对了吗？ 1. 揭秘文件传输：为什么关注传输时间、transferSize、encodedBodySize和decodedBodySize？在这个“速食”时代，等待文件加载是我们生活中的小痛点

云计算 2024-01-25 捡田螺的小男孩

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

作者：斜阳 RocketMQ 5.0 提出了分级存储的新方案，经过数个版本的深度打磨，RocketMQ 的分级存储日渐成熟，并成为降低存储成本的重要特性之一。事实上，几乎所有涉及到存储的产品都会尝试转冷降本，如何针对消息队列的业务场景去做一些有挑战的技术优化，是非常有意思的事。这篇文章就跟大家探讨下，在消息系统这样一个数据密集型应用的模型下，技术架构选型的分析与权衡，以及分级存储实现与未来演进

云计算 2024-01-25 大猫

Kubernetes TLS 101: 在本地 K8s 中轻松部署自签 TLS 证书

随着互联网的飞速发展，安全性日益成为我们关注的焦点。HTTPS 已从一项奢侈的技术逐渐成为现代网络交互的标准。它不仅仅是保护信息的重要工具，更是实现信任和品质的象征。当你在本地的 K8S 开发环境中遇到需要使用 HTTPS 来进行访问，又该如何为其配置 TLS/SSL 证书呢？🤔 今天，让我们一起揭秘如何在 K8S 环境中轻松自签证书，为你的本地开发环境带来安全性的提升！ 0. Preparat

云计算 2024-01-25 爱可生开源社区

Kubernetes TLS 101: 在本地 K8s 中轻松部署自签 TLS 证书

Kruise Rollout 全链路灰度实践

作者：旦酱、十眠什么是全链路灰度？在发布应用的过程中，我们通常希望用少量特定流量来验证新版本的发布是否正常，以保障整体稳定性。这个过程被称为灰度发布。关于灰度发布，我们通过逐步增加发布的范围，来验证新版本的稳定性。如果新版本出现问题，我们也能及时发现，控制影响范围，保障整体的稳定性。灰度发布一般具有以下特点：逐步增加发布的影响范围，拒绝一次性全部发布。阶段性的发布过程，可以通过金丝雀发布

云计算 2024-01-24 共饮一杯

Kubernetes多租户实践

由于namespace本身的限制，Kubernetes对多租户的支持面临很多困难，本文梳理了K8S多租户支持的难点以及可能的解决方案。原文: Multi-tenancy in Kubernetes 是否应该让多个团队使用同一个Kubernetes集群? 是否能让不受信任的用户安全的运行不受信任的工作负载? Kubernetes支持多租户吗? 本文将探讨支持多租户的集群所面临的挑战。多租户可以分为

云计算 2024-01-24 法医

云原生网关哪家强：Sealos 网关血泪史

作者：Sealos 创始人，环界云计算 CEO 方海涛 Sealos 公有云（cloud.sealos.io）几乎打爆了市面上所有主流的开源网关，本文可以给大家很好的避坑，在网关选型方面做一些参考。 Sealos Cloud 的复杂场景 Sealos 公有云上线以来，用户呈爆发式增长，目前总共注册用户 8.7w，每个用户都去创建应用，每个应用都需要有自己的访问入口，就导致整个集群路由条目非常巨

云计算 2024-01-24 醒在深海的猫

Kube Queue：Kubernetes 任务排队的利器

作者：吴昆批处理作业（Batch Job）常应用于数据处理、仿真计算、科学计算和人工智能等领域，主要用于执行一次数据处理或模型训练任务。由于这类任务往往需要消耗大量计算资源，因此必须根据任务的优先级和提交者的可用资源情况进行合理排队，才能最大化集群资源的利用效率。 Scheduler 在任务调度领域水土不服当前 Kubernetes 的调度器提供了完善的 Pod 通用调度功能，但是在面对大量任

云计算 2024-01-24 大树

Koordinator v1.4 正式发布！为用户带来更多的计算负载类型和更灵活的资源管理机制

作者：乔普背景 Koordinator 作为一个积极发展的开源项目，自 2022 年 4 月发布 v0.1.0 版本以来，经历了多次迭代，持续为 Kubernetes 生态系统带来创新和增强。项目的核心是提供混部工作负载编排、混部资源调度、混部资源隔离和混部性能调优的综合解决方案，帮助用户优化容器性能，并提升集群资源使用效率。在过去的版本迭代中，Koordinator 社区不断壮大，已经得到了

云计算 2024-01-24 贤蛋大眼萌

Koordinator v1.4 正式发布！为用户带来更多的计算负载类型和更灵活的资源管理机制

大语言模型推理提速：TensorRTLLM 高性能推理实践

作者：顾静 TensorRT-LLM 如何提升 LLM 模型推理效率大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型。底层转换器是一组神经网络，这些神经网络由具有 self-attention 的编码器和解码器组成。编码器和解码器从一系列文本中提取含义，并理解其中的单词和短语之间的关系。当前 LLM 模型推理的主要瓶颈是 GPU 显

云计算 2024-01-24 向阳逐梦

应用监控 eBPF 版：实现高效协议解析的技术探索

作者：彦鸿引言随着 Kuberentes 等云原生技术的飞速发展，带来了研发与运维模式的变革。企业软件架构由单体服务向分布式、微服务演进。随着业务发展，多语言、多框架、多协议的微服务在企业中越来越多，软件架构复杂度越来越高，如何快速通过可观测工具快速定位出问题对研发人员至关重要。为满足全场景、端到端的应用监控需求，应用实时监控服务 ARMS 推出应用监控 eBPF 版，通过 eBPF 技术完善

云计算 2024-01-24 剑圣无痕

对接alertmanager创建钉钉卡片(1)

很多时候，依靠通过alertmanager的标签来进行分组将不同的警报发送到不同的人，亦或者拉起一个群来接收一条关键的警告。在大多数时候，我门希望能够减少告警疲劳。要完成这样的动作，至少需要简化告警条目，优化阈值数值。其次针对告警信息进行合并，对于告警和恢复进行统计。我们处理的是alertmanager的告警通知，主要的功能如下： 1，忽略不必要的警报2，通过回调，人员领取警报并记录3，沉默警报

云计算 2024-01-23 LOVEHL^ˇ^

秒级弹性！探索弹性调度与虚拟节点如何迅速响应瞬时算力需求？

作者：吴昆前言在前面的文章《弹性调度助力企业灵活应对业务变化，高效管理云上资源》中，我们介绍了阿里云容器服务 ACK 弹性调度为了帮助客户解决在使用云上弹性资源时，面对的“难以差异化控制业务资源使用量，缩容时部分业务 Pod 未释放”等挑战，提供了按照多级资源的优先顺序进行调度，以及按照定义的优先顺序进行缩容的能力。本文将介绍弹性调度如何使用虚拟节点来满足您的业务弹性需求。企业在实施应用弹

云计算 2024-01-23 泡泡

火山引擎ByteHouse：“专用向量数据库”与“数据库+向量扩展”，怎么选？

更多技术交流、求职机会，欢迎关注字节跳动数据平台微信公众号，回复【1】进入官方交流群背景随着LLM（Large Language Model）的不断发展，向量检索也逐渐成为关注的焦点。LLM通过处理大量的文本数据，获取丰富的语义信息，从而能够更好地理解和生成自然语言。然而，LLM的输出通常是一系列概率分布，这使得检索过程变得复杂。向量检索作为一种有效的检索方法，它将LLM的输出转化为向量表示，

云计算 2024-01-23 剑圣无痕

进击的 Serverless：Java 应用如何从容地面对突增流量

作者：袭周、十眠让我们从一个十分常见的业务场景说起。移动互联网时代，许许多多的业务都有着流量的周期性变化，无论是直播、游戏、点单系统、电商平台等等，都会存在着流量的高峰与波谷。如果采用固定的计算资源部署服务，使用的多了，大量资源在流量波谷闲置浪费，使用的少了，服务难以抗住高峰期的大规模流量，易带来业务损耗。尤其在大促或节日期间，难以预估具体需要的计算资源数量，同时不论水平还是垂直扩容，人工操

云计算 2024-01-23 泡泡

乘云向未来 | 算力基础设施护航业务平稳上云实践

火山引擎公共云城市分享会，精彩回顾数字时代，云始终是企业实现数字化转型和增长的关键底座。随着新一轮公共云竞争的日渐火热，新的基于算力和基础设施的需求蓬勃生长。在这场上云热潮中，什么样的基础设施产品能够打出优势，竞得一方“云上天空”？ 2023年11月10日-24日，“乘云·向未来”火山引擎公共云·城市分享会先后走进北京、上海、深圳，会上火山引擎以“算力基础设施护航业务平稳上云实践”为题，分享了火

云计算 2024-01-23 泡泡

字节跳动开源 Gödel Scheduler：在离线统一调度器

作为字节跳动在离线混部场景中最核心的调度系统，Gödel 提供丰富的资源 QoS 管理能力，可以统一调度在线和离线应用，极大提升资源利用率。来源 | KubeWharf 社区项目 | github.com/kubewharf/godel-scheduler 自 2014 年开源以来，Kubernetes 迅速成为容器编排领域内的事实标准，字节跳动基础架构团队也早早确定了以 Kubernetes

云计算 2024-01-23 向阳逐梦

资源对象 Kubernetes 遵循 RESTful 风格管理其 API 资源对象，支持通过标准的 HTTP 方法，POST、PUT、PATCH、DELETE、GET对资源进行增删改查等操作。Kubernetes 的 API 对象总的来说可以分为以下几类：工作负载、服务发现、负载均衡、配置和存储、集群、元数据。他们都是围绕 pod 而设计的，能够让使用者更好地运行和使用 pod 资源，从而实现容器

云计算 2024-01-22 泡泡

Kmesh v0.1.0 版本发布

本文分享自华为云社区《Kmesh v0.1.0 版本发布！打造极致性能的流量治理体验》，作者：云容器大未来。 Kmesh是业内首个内核级云原生流量治理引擎，通过基础软件创新帮助用户构筑云原生场景下高性能的通信基础设施。Kmesh第一个版本v0.1.0 [1]现已正式发布，用户可以在服务网格环境中使用yaml一键部署，无缝对接Istiod，通过流量治理下沉OS，实现相比 Istio Sidecar

云计算 2024-01-22 宇宙之一粟

当 OpenTelemetry 遇上阿里云 Prometheus

作者：逸陵背景在云原生可观测蓬勃发展的当下，想必大家对 OpenTelemetry & Prometheus 并不是太陌生。OpenTelemetry 是 CNCF（Cloud Native Computing Foundation）旗下的开源项目，它的目标是在云原生时代成为应用性能监控领域的事实标准，它提供了一套统一的 API 和 SDK，用于生成、收集和处理分布式系统的遥测数据。总

云计算 2024-01-22 法医

阿里云 ACK 云原生 AI 套件中的分布式弹性训练实践

作者：霍智鑫众所周知，随着时间的推移，算力成为了 AI 行业演进一个不可或缺的因素。在数据量日益庞大、模型体量不断增加的今天，企业对分布式算力和模型训练效率的需求成为了首要的任务。如何更好的、更高效率的以及更具性价比的利用算力，使用更低的成本来训练不断的迭代 AI 模型，变成了迫切需要解决的问题。而分布式训练的演进很好的体现了 AI 模型发展的过程。 Distributed Training 分

云计算 2024-01-22 竹子爱熊猫

上一页 1 … 14 15 16 … 166 下一页