选型建议

基于不用的用户场景和行业特点，Wyn 提供多种建模方式，本文针对各种数据集和数据模型的适用场景和行业特点从多个维度给出了初步的选型建议供您参考。如果本页内容未能有效帮助您选型，可以联系我们的技术支持进一步咨询。

数据建模方式总结和概览

在开始选型之前，我们先对 Wyn 提供的所有建模方式做一个整体的认识，概览如下：

内容	简介	功能教程	使用范围
直连模型	直连一个单一数据源的数据库，实时查询数据库中多张表的数据并对返回的数据进一步加工、处理，同时可以导入和管理表关系，形成可用于分析的业务模型。	直连模型	仪表板
抽取模型	可跨源抽取多个数据源的数据库，并导入和管理表关系，将需要分析的多个业务场景的数据导入一个模型中，同时添加安全过滤器隔离不同角色、组织的数据。	抽取模型	仪表板
直连数据集	对分散、异构数据源中的数据联合处理整合形成一张宽表，直连数据库查询返回数据，用于某个业务场景分析的轻量级模型。	缓存/直连数据集	报表
缓存数据集	与直连数据集类似，缓存数据集对加工好的数据在本地进行缓存，再用于制作仪表板和报表。	缓存/直连数据集	仪表板
流式数据集	服务端直接将数据通过接口主动推送到 Wyn 并保持数据状态的更新，将数据存储到临时缓存中一段时间，适用于分析一段短时间内的数据实时曲线变化，速度更快，占用资源更少。	流式数据集	仪表板报表
推送数据集	无需搭建数据库，服务端可直接将数据推送过来将数据写到磁盘数据库中用于分析，同时可设置数据驻留时间，主要用于对实时性要求比较高的分析场景，和长时间段的历史数据趋势，存储的数据可用于分析趋势、历史记录等。	推送数据集	仪表板报表
原生查询数据集	对于有原生查询语法的特定数据源，以及生产制造行业采集存储的时序数据，可通过原生查询的语法实时查询和将数据展示在仪表板和报表上进行展示和分析。	原生查询数据集	仪表板报表

接下来我们从多个维度了解如何选型。

基于分析的时效性选型

直连模型VS抽取模型

虽然都是数据模型，但由于一个是直连数据库，另一个是抽取缓存模式，所以两者的区别也非常明显。

在选型时，主要从以下几个方面考虑：

当您需要跨源建模时，只能使用抽取模型。因为抽取模型支持跨源建模，而直连模型仅支持单个数据源数据建模。
直连模型对数据库类型有限制，仅支持部分数据库类型，如Oracle、SQL Server、Mysql、Postgres、TimeScale、AnalyticDB、MariaDB、BigQuery、DB2以及Web JSON 等（具体以界面为准）。
所以除了这些数据源之外，其他数据源则只能使用抽取模型。
直连模型直连数据库，数据结构更加灵活，数据实时更新，常用于已有数据仓库和实时性要求较高的数据分析。
缓存模型将数据提前缓存起来，交互时不占用数据库资源。但由于经历了缓存过程，数据不是实时更新的，需要配置刷新计划进行数据刷新。

缓存数据集VS直连数据集

因为仪表板仅能使用缓存数据集，所以只有为报表数据集选型时涉及对比这两种数据集。

在选型时，主要从以下几个方面考虑：

缓存数据集将数据抽取到缓存中，交互时不占用数据库资源。也是由于经历了缓存过程，数据不是实时更新的，需通过刷新计划进行数据同步。
直连数据集中仅包含对相关运算过程的定义，实际的数据在浏览报表时获取，因此直连数据集的数据是实时刷新的。

综上，为报表准备数据时更推荐使用直连数据集；如仅需阶段性更新数据时则可以使用缓存数据集。

抽取模型VS缓存数据集

两者都是使用高性能的缓存数据库缓存数据且均支持跨源。

抽取模型可以将原数据库的表关系自动带入模型中，无需手动创建；而在缓存数据集中，则需要用户自行创建关联关系。

所以抽取模型更适合数据表较多且关系复杂的场景；而缓存数据集则更适合数据表较少，结构简单的场景。

原生查询数据集

原生查询数据集专为那些想要在Wyn中直接使用数据的行业而研发，比如电力行业、化工行业、气象行业等。

这些行业往往希望能查询数据并进行实时的显示，比如当前温度、当前湿度、过去十分钟的产品合格率曲线等。

原生查询数据集的主要特点是使用数据库原生语法进行数据查询，比较灵活。尤其是当已经有编写好的查询语句时，可以在创建数据集时直接获取处理好的数据，然后在仪表板中直接展示。

另外，原生查询数据集在仪表板中不能进行进一步的数据加工和处理，仅能展示。

综上，原生查询数据集适合处理数据量大，对实时性要求高、已经使用原生语法编写好查询语句想要直接展示数据的场景。

流式数据集VS推送数据集

流式/推送数据集与其他数据集不同，是由数据设备主动向Wyn推送数据。

通过对接设备源，工厂传感器，社交媒体流，服务器敏感数据收集，空气质量检测点数据发送等等一系列高频次数据源，第一时间完成实时的可视化展示。

流式数据集和推送数据集本身也有明显的区别：

流式数据集用于处理阶段性实时数据的需求场景，通过驻留时间的设置实现对数据的流式处理，接收实时数据并清空之前的内容，可以处理吞吐量大，实时性高的数据。
而推送数据集不设置驻留时间，一直累积历史数据，所以会不停的存储推送来的数据。所以更适合分析历史感较强的长时间段的数据走势。

数据建模方式总结和概览
基于分析的时效性选型
直连模型VS抽取模型
缓存数据集VS直连数据集
抽取模型VS缓存数据集
原生查询数据集
流式数据集VS推送数据集