NeuSeer 工业数据管理系统
NeuSeer DM
寄云工业数据管理系统是一站式大数据应用基础设施,支持构建数据驱动业务的闭环生态体系,结合业务场景释放数据价值的力量,实现应用创新与赋能业务。工业数据管理系统集成了数据接入、数据融合、数据治理、数据服务等产品化的大数据全生命周期能力,可以轻松实现对企业业务及生产数据的管理,构建数据标准规范体系、提升数据质量,发挥数据价值,赋能企业数字化转型。
产品优势
产品功能
资产目录
提供统一的数据资产共享目录,通过资产分类、资产标签统一管理接入的结构化及非结构化数据资产,支持数据订阅、查看、API接口、资源下载等多种数据共享方式,能够对数据资产的数据内容、元数据信息进行查看。
数据接入
统一的数据源端注册和管理能力,支持对所注册数据源的连通性进行有效性验证,可以基于已注册且连通的数据源,构建虚拟视图。提供可扩展的共享文件存储服务,支持多格式文件的上传、下载和管理,具备非结构化数据存储和管理能力。
数据建模
构建包含数据内容以及数据实体和属性之间关系的数据模型,支持对模型属性、对象进行灵活定义,支持模型,帮助用户规范快捷实现数据建模,进而支持数据对象的实例化构建。
数据融合
提供强大的统一融合平台,实现对多源异构的原始数据按照规则进行标注、清洗、过滤、转换、加工、同步等操作,输出满足业务需求的高质量数据,支持数据建模,支持企业决策、支持业务创新。
数据服务
支持以数据对象方式快速构建数据服务,涉及数据资产、参考数据、主数据、数据标准规范等公共数据资源,通过API方式对外提供以支持整个企业核心数据共享与统一进而提升数据质量。
数据标准
支持业务术语标准化、枚举项标准化、数据元标准化、标准文档可管理以及标准可检索,实现互联互通、信息共享、业务协同,为建立数据标准体系奠定基础。
数据血缘
“血缘分析”,直观的展示了目标对象的产生过程,帮助用户推测出产生过程中被赋予的含义,以及会受到的潜在影响。“影响分析”反映当前对象在平台中参与了哪些元数据的形成,帮助用户观察该对象的影响能力。
数据质量
借助质量计划、质量规则、质量评估等提升质量的手段,提升数据质量的完整性、一致性、规范性、准确性、唯一性等指标,夯实数据应用基础,发挥数据价值,进而更好地推进数据决策的落地。
NeuSeer 数据分析模型开发系统
NeuSeer DaStudio
寄云数据分析模型开发系统能够快速对接各类实时、结构化和非结构化的异构数据源,自定义跨系统的数据集,通过自带分析组件来快速定义可视化的分析工作流,利用数据集实现分析模型的训练、验证和应用,支持自定义算法组件以及组件共享,提供SPC、RCA等分析模型模板,支持多种模式的分析任务和跨系统的分析模型在线部署,提供分析结果的图表展示。
产品优势
支持丰富的数据源
支持对接多种不同类型的数据源,屏蔽底层的连接细节/数据量,而将来自不同数据源的数据抽象成可直接被分析的数据对象。
支持海量数据的全流程分析
支持可扩展的并行计算引擎,支持海量数据的数据准备、数据处理、组件开发、训练模型、部署任务功能。
支持在线部署
可以直接对接各种实时数据流,实现在线分析。
组件可扩展,支持团队协作
用户可上传自己写好的组件,也可订阅其他用户公开的组件进行建模分析。
低门槛,易操作
整个建模流程设计基于拖拽式布局、连线式流程编排和指导式参数配置,使用者根据业务需要快速完成建模分析,并且每步的操作执行结果支持可视化显示。
产品功能
快速对接数据源
快速对接各类实时、结构化和非结构化的异构数据源,支持自定义跨系统的统一数据集,利用数据来训练和验证模型,并实现数据的高级分析;
丰富的分析组件
提供数百种数据分析组件,并且持续更新迭代,组件包括工业数据预处理、统计、机器学习算法、深度学习、模型评估器、建模(训练、验证、应用)。另外,还提供特定工业组件,包括SPC、数据平滑、PCA、FIR滤波、IIR滤波、FFT、平稳性检验、Apriori、WignerVill分布、Pearson相关系数、方差分析等。组件式开发降低了建模的难度,提高了建模效率;
可视化的分析工作流
通过拖放式对选择的组件进行连接以构建可视化的分析工作流,分步骤运行,每一步都能及时地查看执行结果,从而方便地尝试不同算法组合,快速实现流程化、定制化的数据分析;
自定义算法组件
支持上传算法代码生成自定义的算法组件,组件发布后支持跨团队的订阅和共享;
多种任务部署
平台支持模型实例发布为API任务、定时任务、实时任务、交互式任务等模式。分析模型支持发布到数据管理系统、边缘系统以及云端,实现基于模型的实时计算、边缘计算和云端计算;
数据可视化
支持组件执行结果实时展示及绘图,包括:柱状图、折线图、雷达图等图形,同时提供钻取、联动、缩放、筛选、链接等交互操作。另外,可视化场景可直接生成链接,提供其它应用系统使用。
NeuSeer 时序数据库系统
NeuSeer TSDB
寄云时序数据库系统是专为工业时序数据的接入、存储、查询、展示和管理而设计开发的产品。包含时序数据库和展现平台两部分。通过Kafka数据采集调度模块,对外部历史文件数据进行批量采集调度,对传感器实时产生的数据进行实时采集调度,采集调度后数据经过数据交换、数据处理、数据存储后,在展现平台进行时序数据指标的动态监控,完成数据分析仪表盘等功能,或数据导出进行高级的数据挖掘服务。
产品优势
产品功能
加载服务
支持批量和实时的数据加载,加载服务是采用主从结构实现,主节点负责接收和分发加载及数据索引任务,实际任务由作业节点承担。批量加载和实时加载都需要通过该服务;
数据服务
数据服务是采用是主从结构实现,主节点是协调节点从节点是数据节点。协调节点负责数据节点的负载均衡,并通过规则管理数据的生命周期,所有数据分片的元数据信息都存储在元数据库中。协调节点通过监听元数据库,按照设定的规则通知数据节点加载数据在线/下线过期数据;
查询服务
查询服务节点负责接收用户请求、分发查询、收集和合并结果;
消息队列
为了实现实时/准实时数据的接入及多路分流,引入消息队列服务。在加载节点上启动消费者监听服务,采用pull 的方式将队列中数据加载到时序数据库中;
统一用户界面
统一用户界面针对多种角色用户:管理员/ETL 人员/报表开发人员/分析用户/高级分析用户提供不同的使用入口,用户可通过该入口方便的对系统进行管理、发起加载作业以及进行各种可视化查询分析。
NeuSeer 分布式数据库系统
NeuSeer MPP
寄云分布式数据库系统是一款高性能、高兼容、高可用、低成本的PB级企业海量数据库,是简单友好的下一代PB级实时分析型数据仓库,也是节点数量可以伸缩的数据库集群,能够高效处理I/O数据吞吐和并发计算,在工业生产、数据中心等商业智能应用领域,对海量数据处理的性能极其优异,承载着将工业企业的数据价值实时化分析的重任。
产品优势
全面兼容SQL标准
通过SQL2003 OLAP控制功能全面支持SQL-92和SQL-99,所有查询信息都并行地在整个系统执行。
大规模统一分析处理
在同一个并行数据流引擎上执行所有的查询分析操作,允许分析人员,开发人员和统计人员使用同一个基础架构进行数据分析,支持千万亿字节规模数据的加载操作。
并行分析标准接口
支持并行分析功能,支持主流编程语言,支持自定义函数机器学习等,支持标准数据库接口(ODBC,JDBC,DBI),有良好的商务智能生态。
集中管理动态拓展
提供集群级别管理工具和资源,同时帮助企业对数据仓库等数据中心进行便捷扩展,避免高成本的设备或者SMP服务器升级。
实时计算引擎
MPP和DAG融合计算,CBO优化,向量化执行,内存计算加速。
GPU加速
利用GPU硬件加速OLAP分析,大幅度降低查询延时。
极致弹性
业务透明的在线升级降配,扩缩容,灵活控制成本。
冗余存储引擎
数据更新实时可见,行列混存,粗糙集过滤,聚簇列,索引优化。
产品功能
实时高可用
采用 Standby Master、MirrorSegment 架构,支持真正的高可用;
实时计算引擎
MPP 和 DAG 融合计算,CBO 优化,向量化执行,内存计算加速;
集群管理大规模并行处理
基于大规模并行处理架构,屏蔽数据库服务器群集节点间负载平衡与调度复杂性,实现数据水平分布、并行查询执行、高可用、高速数据加载等强大线性扩展能力;
冗余存储引擎
数据更新实时可见,行列混存,粗糙集过滤,聚簇列,索引优化;
便捷的运维管理
提供了一系列的脚本程序集中管理后台数据库,监控集群内所有节点的运行状态;
安全管控
通过对用户认证和鉴别,存取控制,数据加密和推理控制等安全机制进行安全管控。