本文主要是介绍利用微查询和数据锐化进行大数据探索,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
微查询和数据锐化™
微查询和数据锐化是专利技术,它们协同工作以允许用户与大数据进行交互。Zoomdata查询引擎根据所请求的聚合值类型和预期查询运行时间等条件调用它们。微查询和数据锐化非常适合按日期分区并在具有多个处理核心的群集上运行的大数据。此功能是可选的,可以在数据源定义级别禁用。
Microqueries分批运行以跨数据库分区对数据进行采样。查询引擎提交一个完整的长时间运行查询,该查询与第一组微查询一起运行,进度指示器估计完整查询的进度。完整查询和微查询一直运行,直到完整查询运行完成或用户改变方向(用户改变方向的想法是重要的部分,留在我们身边以了解原因)。如果用户更改方向,则会取消长时间运行的查询和微查询,以节省处理和网络资源。
数据锐化分析累积样本数据,并通过websocket连接将估计结果流式传输到浏览器(或其他客户端)。数据锐化的估计值可能会向上或向下波动,直到报告最终查询。然而,随着数据的锐化,每组的相对值通常保持一致。例如,图表中最高的10%完成条形图几乎总是在100%完成时仍然是最高的条形图。即使在数据流传输到仪表板时,您也可以自信地探索数据。
Ad-Hoc Exploration与报告
您可以在观看数据加载时放大,过滤,重新分组,重新排列,更改甚至创建新的指标和属性 - 或采取任何其他操作。为什么要这么做?因为大量的数据探索和发现是关于识别不符合预期的异常值或数据。使用Zoomdata等可视化分析应用程序,您可以看到它。立即。使用我们的专利技术可以非常快速地形成数据,因此您无需等待令人难以忍受的长时间查询才能解决问题,正如他们所说的那样。
将动态,思维流探索与报告进行对比。报告是回顾性的,报告对他们来说是最终的,符合代表一天,四分之一,一年,人口,地理位置,产品线的快照以及报告中列出的某些期望和假设(提示:“像素-perfection“是关于报告,而不是数据探索。探索可以像数据允许的那样广泛和深入。
下推式处理Redux
还记得Zoomdata如何执行下推式处理吗?重要的是,当您进行需要再次访问数据源的更改时,Zoomdata会取消完整的长时间运行查询和微查询,以便为下一个查询序列释放它。但是,取消活动查询并非易事,许多JDBC和ODBC驱动程序都不支持它。在这些情况下,即使Zoomdata智能数据连接器主要使用JDBC和SQL,它也可以发出本机API调用来完成驱动程序不支持的任务,例如查询取消。它太酷了。
这篇关于利用微查询和数据锐化进行大数据探索的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!