数据集

在过去,客户想要拿到自己想要的数据往往需要通过不同的业务系统或是依赖技术人员帮忙才可以得到结果;CDP对于业务或技术人员非常友好,可以使用数据集只需要通过简单的功能操作就可以拿到想要的数据结果。

什么是数据集?

数据集,指的是一组数据的集合;在传统业务中通常以表格的形式呈现,在互联网技术领域中是指一张包含数据表的对象,可以在这些数据表中存储数据以便在应用程序中使用。它和数据仓库不同,数据集更贴近于业务,链路更短。

功能介绍

数据集

一、数据集列表

1、在数据接入模块中,新增数据集选项,点击后可进入数据集模块

  • 任务:您创建的数据同步或可视化数据集的任务名称,用户自定义且名称不可重复
  • 数据集名称:数据集的名称,由您自定义且名称不可重复
  • 表名:系统自动生成落地至诸葛数仓
  • 创建人:您在分析平台的账号
  • 创建时间:指数据集创建的时间
  • 最近更新时间:只最近一次任务更新完成的时间
  • 下次执行时间:任务为自动执行时,可以看到下次执行时间
  • 更新方式:自动/手动,已点击手动更新,或任务在更新中状态时,按钮不可点击
  • 状态:更新成功/失败
  • 类型:数据库类型及可视化数据集
  • 操作
    • 启用/禁用:任务创建之后,默认为禁用状态;正在执行的任务不可禁用;启用状态下不可进行编辑和删除
    • 编辑:可查看任务创建时的详情信息
    • 删除:启用的任务不可删除,确认删除时您需要确认风险范围
    • 日志:查看最近一次任务情况的日志信息

二、数据同步

1、您若想创建数据集,可以通过数据同步的方式,将您想应用的数据,同步至CDP中来

2、创建数据集 -> 数据同步

创建时,您需要进行如下操作

  • 选择数据库类型
  • 选择数据源
  • 选择数据表
  • 填写数据集名称
  • 选择字段:指您选择的数据表中要同步到CDP的字段
  • 抽取规则配置:自定义数据同步规则,支持定义日期、字符串、数值等类型字段的筛选
  • 更新方式:包含手动/自动更新;手动更新需要手动触发、自动更新您可以选择天、周、月等
  • 任务名称:不可重复,指当前创建的数据集任务名称
  • 任务描述:可以描述当前数据同步的业务含义,方便其他同学理解

经过以上操作,您可以对当前编辑好的数据同步任务进行保存,我们将会帮助您把数据同步到诸葛io仓库中。

©zhugeio.com 京ICP备15049545号            文档更新时间 2022-08-30 21:16:46

results matching ""

    No results matching ""