华为云CCE Turbo:基于eBPF的用户自定义多粒度网络监控能力 本文分享自华为云社区《华为云CCE Turbo:基于eBPF的用户自定义多粒度网络监控能力》,作者: 云容器大未来。 基于eBPF的容器监控的兴起 容器具有极致弹性、标准运行时、易于部署等优点,越来越多的客户选择使用容器来部署自己的服务,随着容器规模越来越大,容器间网络交互也越来越复杂。我们需要一套完整的监控系统,让用户和运维团队可以更清晰的观测容器网络的运行情况。 基本的容器网络监控,和虚机的监 云计算 2024-01-26 泡泡
一文详解全栈可观测的实现路径 作者:曾庆国 作者简介: 曾庆国,来自阿里云智能-云原生可观测团队。过去多年一直从事云原生相关领域工作。从运营开源产品到商业产品研发;从应用交付、平台工程到深入云原生可观测。多次通过 KubeCon、ArchSummit、A2M、云原生峰会等平台分享云原生实践经验。 今天给大家带来一个非常让人兴奋的话题,云原生全栈可观测。 业务系统具备良好的可观测性,是最容易让开发者、运营者和管理者兴奋的。为什么 云计算 2024-01-26 醒在深海的猫
下一代软件架构,如何构建微服务核心能力 作者:李艳林 本文整理自阿里云微服务负责人李艳林在 2023 云栖《下一代软件架构,如何构建微服务核心能力》的分享。 随着数字化进程的加速,各种架构设计思想风起云涌,进入百家争鸣时代,微服务架构,云原生架构,Serverless 架构,事件驱动架构,中台架构,容灾架构,到底哪种思潮代表未来呢? 架构趋势 未来的架构趋势是什么呢?为什么说微服务架构是下一代软件架构呢? 主流架构趋势 每一种架构都有时 云计算 2024-01-25 竹子爱熊猫
上一任留下的 Eureka,我该如何提升她的性能和稳定性(含数据比对)? 作者:聪言 开篇:一次小小的技术讨论 周末的时候,和一位在国内某互联网公司负责运维的朋友聊天,由于工作相关,刚好聊到了公司项目中微服务架构这块的一些问题,他们公司的微服务架构使用的是业界比较常用的 Spring Cloud Netflix 那一套作为底座,有专门的同学负责运维一套自建的 Eureka 集群来作为微服务注册中心。服务注册中心作为微服务领域的核心组件,承载着公司核心业务的高频服务,一旦 云计算 2024-01-25 三掌柜
Katalyst v0.4.0 发布:潮汐混部与资源超分 Katalyst 是字节跳动开源的成本优化实践系统,致力于解决云原生场景下的资源不合理利用问题,为资源管理和成本优化提供解决方案。 来源 | KubeWharf 社区 项目 | github.com/kubewharf/katalyst-core 近日,Katalyst 社区完成了 0.4.0 版本发布。除了持续优化 QoS 能力之外,我们还在新版本中提供了可以独立在原生 Kubernetes 上 云计算 2024-01-25 大树
探索技术的无限可能云原生计算2023年度奖项 在过去的一年里,字节跳动云原生计算团队获得了「DataFun 年度数据智能先锋奖」、「开源中国-优秀开源技术团队」和「火山引擎开发者社区-年度优质内容」奖项。这些奖项既是鼓励,也是鞭策。在未来技术的道路上,我们将继续与大家同行,共同探索技术的无限可能!再次感谢大家对云原生计算团队的关注~ Datafun 年度数据智能先锋奖 规模化的数据智能应用带来无数变量的冲突,不同的权衡取舍造就了不同的技术创新 云计算 2024-01-25 贤蛋大眼萌
减少文件体积,你的姿势对了吗? 嘿,如果你觉得减少文件体积就像找到一种数字瑜伽姿势一样简单,那可就有点“天真”。 优化文件体积需要仔细理想与现实的搭配。这可是一门数字艺术,要找到最佳平衡点。 所以,让我们一同探讨:减少文件体积的姿势,你的对了吗? 1. 揭秘文件传输:为什么关注传输时间、transferSize、encodedBodySize和decodedBodySize? 在这个“速食”时代,等待文件加载是我们生活中的小痛点 云计算 2024-01-25 捡田螺的小男孩
谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化 作者:斜阳 RocketMQ 5.0 提出了分级存储的新方案,经过数个版本的深度打磨,RocketMQ 的分级存储日渐成熟,并成为降低存储成本的重要特性之一。事实上,几乎所有涉及到存储的产品都会尝试转冷降本,如何针对消息队列的业务场景去做一些有挑战的技术优化, 是非常有意思的事。 这篇文章就跟大家探讨下,在消息系统这样一个数据密集型应用的模型下,技术架构选型的分析与权衡,以及分级存储实现与未来演进 云计算 2024-01-25 大猫
Kubernetes TLS 101: 在本地 K8s 中轻松部署自签 TLS 证书 随着互联网的飞速发展,安全性日益成为我们关注的焦点。HTTPS 已从一项奢侈的技术逐渐成为现代网络交互的标准。它不仅仅是保护信息的重要工具,更是实现信任和品质的象征。 当你在本地的 K8S 开发环境中遇到需要使用 HTTPS 来进行访问,又该如何为其配置 TLS/SSL 证书呢?🤔 今天,让我们一起揭秘如何在 K8S 环境中轻松自签证书,为你的本地开发环境带来安全性的提升! 0. Preparat 云计算 2024-01-25 爱可生开源社区
Kruise Rollout 全链路灰度实践 作者:旦酱、十眠 什么是全链路灰度? 在发布应用的过程中,我们通常希望用少量特定流量来验证新版本的发布是否正常,以保障整体稳定性。这个过程被称为灰度发布。关于灰度发布,我们通过逐步增加发布的范围,来验证新版本的稳定性。如果新版本出现问题,我们也能及时发现,控制影响范围,保障整体的稳定性。 灰度发布一般具有以下特点: 逐步增加发布的影响范围,拒绝一次性全部发布。 阶段性的发布过程,可以通过金丝雀发布 云计算 2024-01-24 共饮一杯
Kubernetes多租户实践 由于namespace本身的限制,Kubernetes对多租户的支持面临很多困难,本文梳理了K8S多租户支持的难点以及可能的解决方案。原文: Multi-tenancy in Kubernetes 是否应该让多个团队使用同一个Kubernetes集群? 是否能让不受信任的用户安全的运行不受信任的工作负载? Kubernetes支持多租户吗? 本文将探讨支持多租户的集群所面临的挑战。 多租户可以分为 云计算 2024-01-24 法医
云原生网关哪家强:Sealos 网关血泪史 作者:Sealos 创始人,环界云计算 CEO 方海涛 Sealos 公有云 (cloud.sealos.io) 几乎打爆了市面上所有主流的开源网关,本文可以给大家很好的避坑,在网关选型方面做一些参考。 Sealos Cloud 的复杂场景 Sealos 公有云上线以来,用户呈爆发式增长,目前总共注册用户 8.7w,每个用户都去创建应用,每个应用都需要有自己的访问入口,就导致整个集群路由条目非常巨 云计算 2024-01-24 醒在深海的猫
Kube Queue:Kubernetes 任务排队的利器 作者:吴昆 批处理作业(Batch Job)常应用于数据处理、仿真计算、科学计算和人工智能等领域,主要用于执行一次数据处理或模型训练任务。由于这类任务往往需要消耗大量计算资源,因此必须根据任务的优先级和提交者的可用资源情况进行合理排队,才能最大化集群资源的利用效率。 Scheduler 在任务调度领域水土不服 当前 Kubernetes 的调度器提供了完善的 Pod 通用调度功能,但是在面对大量任 云计算 2024-01-24 大树
Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制 作者:乔普 背景 Koordinator 作为一个积极发展的开源项目,自 2022 年 4 月发布 v0.1.0 版本以来,经历了多次迭代,持续为 Kubernetes 生态系统带来创新和增强。项目的核心是提供混部工作负载编排、混部资源调度、混部资源隔离和混部性能调优的综合解决方案,帮助用户优化容器性能,并提升集群资源使用效率。 在过去的版本迭代中,Koordinator 社区不断壮大,已经得到了 云计算 2024-01-24 贤蛋大眼萌
大语言模型推理提速:TensorRTLLM 高性能推理实践 作者:顾静 TensorRT-LLM 如何提升 LLM 模型推理效率 大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型。底层转换器是一组神经网络,这些神经网络由具有 self-attention 的编码器和解码器组成。编码器和解码器从一系列文本中提取含义,并理解其中的单词和短语之间的关系。 当前 LLM 模型推理的主要瓶颈是 GPU 显 云计算 2024-01-24 向阳逐梦
应用监控 eBPF 版:实现高效协议解析的技术探索 作者:彦鸿 引言 随着 Kuberentes 等云原生技术的飞速发展,带来了研发与运维模式的变革。企业软件架构由单体服务向分布式、微服务演进。随着业务发展,多语言、多框架、多协议的微服务在企业中越来越多,软件架构复杂度越来越高,如何快速通过可观测工具快速定位出问题对研发人员至关重要。为满足全场景、端到端的应用监控需求,应用实时监控服务 ARMS 推出应用监控 eBPF 版,通过 eBPF 技术完善 云计算 2024-01-24 剑圣无痕
对接alertmanager创建钉钉卡片(1) 很多时候,依靠通过alertmanager的标签来进行分组将不同的警报发送到不同的人,亦或者拉起一个群来接收一条关键的警告。在大多数时候,我门希望能够减少告警疲劳。要完成这样的动作,至少需要简化告警条目,优化阈值数值。其次针对告警信息进行合并,对于告警和恢复进行统计。 我们处理的是alertmanager的告警通知,主要的功能如下: 1,忽略不必要的警报2,通过回调,人员领取警报并记录3,沉默警报 云计算 2024-01-23 LOVEHL^ˇ^
秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求? 作者:吴昆 前言 在前面的文章《弹性调度助力企业灵活应对业务变化,高效管理云上资源》中,我们介绍了阿里云容器服务 ACK 弹性调度为了帮助客户解决在使用云上弹性资源时,面对的“难以差异化控制业务资源使用量,缩容时部分业务 Pod 未释放”等挑战,提供了按照多级资源的优先顺序进行调度,以及按照定义的优先顺序进行缩容的能力。 本文将介绍弹性调度如何使用虚拟节点来满足您的业务弹性需求。 企业在实施应用弹 云计算 2024-01-23 泡泡
火山引擎ByteHouse:“专用向量数据库”与“数据库+向量扩展”,怎么选? 更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 背景 随着LLM(Large Language Model)的不断发展,向量检索也逐渐成为关注的焦点。LLM通过处理大量的文本数据,获取丰富的语义信息,从而能够更好地理解和生成自然语言。然而,LLM的输出通常是一系列概率分布,这使得检索过程变得复杂。向量检索作为一种有效的检索方法,它将LLM的输出转化为向量表示, 云计算 2024-01-23 剑圣无痕
进击的 Serverless:Java 应用如何从容地面对突增流量 作者:袭周、十眠 让我们从一个十分常见的业务场景说起。 移动互联网时代,许许多多的业务都有着流量的周期性变化,无论是直播、游戏、点单系统、电商平台等等,都会存在着流量的高峰与波谷。如果采用固定的计算资源部署服务,使用的多了,大量资源在流量波谷闲置浪费,使用的少了,服务难以抗住高峰期的大规模流量,易带来业务损耗。 尤其在大促或节日期间,难以预估具体需要的计算资源数量,同时不论水平还是垂直扩容,人工操 云计算 2024-01-23 泡泡