标签：hive - 每日运维网

在 Apache Hive 中轻松生存的12个技巧

Hive 可以让你在 Hadoop 上使用 SQL，但是在分布式系统上优化 SQL 则有所不同。这里是让你可以轻松驾驭 Hive 的12个技巧。Hive 并不是关系型数据库（RDBMS），但是它大多数时候都表现得像是一个关系型数据库一样，它有表、可以运行 SQL、也支持 JDBC 和 ODBC。这种

向阳逐梦 2024-07-19

0 0 0

60 TB 数据：Facebook 是如何大规模使用 Apache Spark 的

Facebook 经常使用数据驱动的分析方法来做决策。在过去的几年，用户和产品的增长已经需要我们的分析工程师一次查询就要操作数十 TB 大小的数据集。我们的一些批量分析执行在古老的 Hive 平台（ Apache Hive 由 Facebook 贡献于 2009 年）和 Corona 上——这是我们

法医 2024-07-19

0 0 0

Hive SQL底层执行过程详细剖析

HiveHive是什么？Hive 是数据仓库工具，再具体点就是一个 SQL 解析引擎，因为它即不负责存储数据，也不负责计算数据，只负责解析 SQL，记录元数据。Hive直接访问存储在 HDFS 中或者 HBase 中的文件，通过 MapReduce、Spark 或 Tez 执行查询。我们今天来聊的就

共饮一杯 2024-05-16

0 0 0

从 Hive 到 OceanBase，构建高效的实时数仓系统

我们的业务场景与出行息息相关，由于业务早期采用的数仓方案存在时延高、效率低等问题，我们开始寻找新的数仓解决方案。本文介绍我们的方案选型与实践经验总结，希望能给你带来参考价值。旧方案（Hive + Spark）的三个挑战线上业务环境主要以数据统计与查询分析为主，数据来源主要有两部分：一部分是通过前端应

醒在深海的猫 2024-05-07

0 0 0

Centos7安装配置Hive教程。

当在CentOS 7上安装和配置Hive时，可以按照以下步骤进行操作：确保已安装Java：首先，确保在CentOS 7上已经安装了Java。可以使用以下命令检查Java是否已安装： java -version 如果没有安装Java，请根据你的需要安装合适的Java版本。下载Hiv

穿过生命散发芬芳 2024-02-04

0 0 0

怎么查看hive和mysql的连接

Hive和MySQL是两种不同的数据库管理系统，它们之间是可以建立连接的。在实际使用中，需要查看连接的状态，以下是具体的方法。1.查看Hive与MySQL是否连接$ hive hive>show databases;在运行show databases之前需要启动Hive，之后使用show d

剑圣无痕 2023-11-26

0 0 0

怎么把数据从hive导入mysql

大家好，今天我来给大家介绍一下如何把数据从hive导入mysql。首先，我们需要在hive中查询到要导出的数据，使用以下命令：SELECT * FROM table_name;接着，我们需要将查询出的结果保存成文件，使用以下命令：INSERT OVERWRITE LOCAL DIRECTORY '/

泡泡 2023-11-10

0 0 0

MySQL 到 TiDB：vivo 的 Hive Metastore 横向扩展之路

以下文章来源于公众号 vivo 互联网技术，作者 Wang Zhiwen 导读本文介绍了 vivo 在大数据元数据服务横向扩展道路上的探索历程，由实际面临的问题出发，对当前主流的横向扩展方案进行了调研及对比测试，通过多方面对比数据择优选择 TiDB 方案。同时分享了整个扩展方案流程、实施遇到的问

LOVEHL^ˇ^ 2023-10-30

0 0 0

配置Hive使用Spark执行引擎

Hive引擎概述在Hive中，可以通过配置来指定使用不同的执行引擎。Hive执行引擎包括：默认MR、tez、spark MapReduce引擎：早期版本Hive使用MapReduce作为执行引擎。MapReduce是Hadoop的一种计算模型，它通过将数据划分为小块并在集群上并行处理来完

向阳逐梦 2023-10-15

0 0 0

【最佳实践2个步骤教你从Mysql同步到Hive

【实现简单的逻辑】Mysql数据同步到Hive,大致流程如下：分为离线和实时两部分，我们先实现离线，需要以下内容：Flink，SeaTunnel，Mysql，Hive，Hadoop，Java。离线Mysql到Hive数据同步1）准备所需要的2）开始Mysql创建数据库及其内容-- 创建数据库crea

捡田螺的小男孩 2023-10-13

0 0 0

ByConity 技术详解之 Hive 外表和数据湖

作者：Liu Cao 随着大数据处理需求的不断增加，更低成本的存储和更统一的分析视角变得愈发重要。数据仓库作为企业核心决策支持系统，如何接入外部数据存储已经是一个技术选型必须考虑的问题。也出于同样的考虑，ByConity 0.2.0 中发布了一系列对接外部存储的能力，初步实现对 Hive 外表及数

醒在深海的猫 2023-10-11

0 0 0

MySQL到TiDB：Hive Metastore横向扩展之路

作者：vivo 互联网大数据团队 - Wang Zhiwen 本文介绍了vivo在大数据元数据服务横向扩展道路上的探索历程，由实际面临的问题出发，对当前主流的横向扩展方案进行了调研及对比测试，通过多方面对比数据择优选择TiDB方案。其次分享了整个扩展方案流程、实施遇到的问题及解决方案，对于在大数据

宇宙之一粟 2023-09-28

0 0 0

十分钟掌握Doris，超越Hive、Elasticsearch和PostgreSQL

以前，数据仓库通常由Apache Hive、MySQL、Elasticsearch和PostgreSQL组成。它们支持数据仓库的数据计算和数据存储层：数据计算：Apache Hive作为计算引擎。数据存储：MySQL为DataBank、Tableau和我们面向客户的应用程序提供数据。Elastics

大白菜程序猿 2023-09-27

0 0 0

如何使用Java开发一个基于Hive的数据仓库应用

如何使用Java开发一个基于Hive的数据仓库应用引言：在当今大数据时代，数据仓库是企业存储和处理海量数据的重要工具。Hive作为Hadoop生态系统中的一员，提供了数据仓库解决方案。本文旨在介绍如何使用Java开发一个基于Hive的数据仓库应用，并提供详细的代码示例。一、准备工作在开始之前，我们需

大树 2023-09-21

0 0 0

怎么验证hive和MySQL的连接

在使用Hive时，有时需要直接连接MySQL数据库进行数据操作。但在进行连接之前，需要先验证Hive和MySQL的连接是否成功。以下是验证步骤：1.启动Hive之后，使用“!”进入Hive的命令行模式。 2.在命令行模式下，使用“!jdbc:mysql://host:port/database”的

大树 2023-09-12

0 0 0

hive表数据更新merge into

背景：根据甲方要求，需要对大数据平台指定表(hive、impala表)的历史数据[2021-01-01至2023-03-29]指定字段进行批量更新，然后把表同步到Oracle。先更新大数据平台上的表，再把更新完成的表同步到Oracle。hive有8张表更新，其中4张大表【分区表】（数据量分别为

大白菜程序猿 2023-08-26

0 0 0

从源代码编译构建Hive3.1.3

编译说明使用Hive官方提供的预编译安装包是最常见和推荐的方式来使用Hive，适用于大多数用户。这些预编译的安装包经过了测试和验证，在许多不同的环境中都能正常运行。在某些特定情况下，可能需要从源代码编译Hive，而不是使用预编译的安装包。编译Hive源代码的场景、原因如下： 1.定制配

大白菜程序猿 2023-08-13

0 0 0

基于idea操作hbase数据库并映射到hive表

目录一：先关闭所有服务二：配置文件三：启动服务依赖条件：需要有hadoop，Hive，ZooKeeper，HBase环境映射：每一个在 Hive 表中的域都存在于 HBase 中，而在 Hive 表中不需要包含所有HBase 中的列。HBase 中的 RowKey 对应到 Hive 中为选择一个域

共饮一杯 2023-08-12

0 0 0

Hive实现简单快捷的HDFS数据库删除 (hive删除hdfs中的数据库)

在Hadoop生态系统中，Hive是一个基于HDFS（Hadoop分布式文件系统）的数据仓库解决方案，用于数据的存储和分析。然而，当我们需要删除Hive中的一些数据时，可能会对HDFS数据库操作的复杂性感到困惑。本文将介绍如何通过。 1. 理解Hive和HDFS 在开始讲解如何通过Hive删除HDF

穿过生命散发芬芳 2023-08-11

0 0 0

Hive数据库默认密码及其修改方法 (hive数据库默认密码)

Hive数据库是Apache Hadoop项目的一个分支，提供了一种将结构化数据映射到Hadoop分布式文件系统中的机制。它允许用户通过SQL查询Hadoop数据源，并将结果转换为常见数据格式，例如ON、CSV和Apache Parquet等，使得处理海量数据变得更加容易和高效。但是，对于Hive

贤蛋大眼萌 2023-08-09

0 0 0

1 2 »