今天阳光很暖
05
15
03
08
02
27
17
ARM 服务器编译部署 GreenPlum 6.9 ARM 服务器编译部署 GreenPlum 6.9
Greenplum是一款全球领先的开源大数据平台,为全球各行各业提供具备实时处理、弹性扩容、弹性计算、混合负载、云原生和集成数据分析能力的强大的大数据引擎,目前广泛的应用于包括金融、保险、证券、通信、航空、物流、零售、媒体、政府、医疗、制造
2022-02-17
01
20
ClickHouse 常见错误码 ClickHouse 常见错误码
1. 介绍ClickHouse 是一种高性能列式数据库管理系统,专为在线分析处理(OLAP)场景设计。它具有高查询性能、水平可扩展性和实时数据更新等优点,广泛应用于大数据分析领域。在使用 ClickHouse 时,用户可能会遇到各种错误。为
2022-01-20
03
12
18
Hive 数据倾斜问题定位以及排查 Hive 数据倾斜问题定位以及排查
1. 背景介绍多数介绍数据倾斜的文章都是以大篇幅的理论为主,并没有给出具体的数据倾斜案例。当工作中遇到了倾斜问题,这些理论很难直接应用,导致我们面对倾斜时还是不知所措。 今天我们不扯大篇理论,直接以例子来实践,排查是否出现了数据倾斜,具体是
2021-12-18
07
11
14
关于 HDFS 中小文件的处理方式 关于 HDFS 中小文件的处理方式
1. 介绍在Hadoop应用过程中,处理小文件问题是一项常见的挑战。由于HDFS主要针对大型数据集(M字节以上)设计,大量小文件的出现可能导致Namenode内存使用效率下降、RPC调用速度减慢、block扫描处理速度降低,从而影响整个应用
2021-11-14
10
25
24
Atlas 架构与组件介绍 Atlas 架构与组件介绍
1. Atlas 概述Apache Atlas 是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。用以构
2021-10-24
19
Ambari 添加 Atlas 组件 Ambari 添加 Atlas 组件
本文章中部署Atlas 是在 Ambari 中部署的, 如果没有 Ambari 环境, 并且想部署 Ambari 可以查看Amabari 环境部署 1. 准备工作安装 Atlas 之前需要安装好 Solr. 2. 添加 Atlas 服务
2021-10-19
2 / 24