[]
        
(Showing Draft Content)

GreenPlum 数据连接

Greenplum 是基于数据库分布式架构的开源大数据平台,采用无共享(no shareing)的 MPP 架构,具有良好的线性扩展能力,具有高效的并行运算、并行存储等特性。拥有独特的高效的 ORCA 优化器。兼容SQL 语法。适合用于高效PB数据量级的存储、处理和实时分析能力。由于内核是基于 PostgreSQL 数据库,也支持涵盖 OLTP 型业务混合负载。同时数据节点和主节点都有自己备份节点。提供数据库的高可用性。

本节为您介绍如何在系统中连接 GreenPlum。

连接 GreenPlum 数据源

1. 在系统的门户网站中单击 image2018-7-30_10-56-34.png,选择数据源

image2022-5-12_14-10-48.png

2. 在左侧数据源列表或者在右侧图标视图中选择 GreenPlum

image2021-5-19_14-3-45.png

3. 填写数据库配置信息。

image2021-5-7_17-2-44.png

参数

说明

端口

端口号,默认为9200。

用户名

连接数据库的用户名。

服务器

服务器名或IP。

密码

连接数据库用户的密码。

名称

必填参数,自定义输入数据源的名称。

使用配置连接字符串(高级)

如果您勾选了此选项,则只需要填写此项与数据源的名称即可。填写此项的格式为:

USER ID=myUserId; Password=myPassword; Host=myPostgresDBHost; Port=myServerPort; Database=myDataBase;

比如:Host=gcs-testing-01;UserID=greenplum;Password=123456ab;Database=test

另外,字串中可以使用用户上下文和组织上下文来进行数据过滤。格式为:

“@{用户上下文名称}”如“@{DBName}”,详见用户上下文属性管理

和“#{组织信息上下文}”如“#{DBName}”,详见组织属性和组织信息上下文

使用表/字段名称映射

修改数据源中的表名或列名,使其在数据集中显示为希望的名称。

详情请见使用表/字段名称映射(修改数据源表名或列名)

4. (可选)可通过单击页面左下角的测试数据连接测试连接是否正常。

image2021-5-7_17-6-7.png

image2019-11-4_17-33-26.png

5. 单击创建,创建数据源。

image2021-5-7_17-6-24.png

6. 创建成功后,在门户网站的未分类数据源中均可以看到刚刚创建的数据源。单击数据源的名称即可预览。

image2022-5-12_17-46-6.png

数据源创建成功后即可进行缓存/直连数据集,以供后续数据分析展示使用。

数据源管理

数据源创建成功后,可在门户网站中对其进行管理操作。

可以像其他文档一样进行编辑、设为主页、复制链接、管理分类、删除、收藏、下载、重命名等一系列管理操作,具体操作请详见第三章 门户网站介绍