检查保持大数据质量和发现新颖解决方案的问题。您将学习四大V 数据,包括准确性,并从各个角度研究问题。讨论的解决方案来自工程和数学的各个领域,包括机器学习,统计,形式方法和区块链技术。
大数据的准确性是对机器学习算法和各种技术(如卡尔曼滤波器,SPRT,CUSUM,模糊逻辑和区块链)的介绍,展示了它们如何用于解决准确性领域的问题。使用示例,技术背后的数学用易于理解的语言解释。
确定实际应用程序中大数据的真实性涉及使用各种工具来分析可用信息。本书深入研究了一些可以使用的技术。Twitter等微博网站在公共生活中发挥了重要作用,包括在总统选举期间。本书使用在特定主题上发布的微博示例来演示如何检查和建立准确性。在检测微博网站上的隐藏攻击以影响公众舆论的背景下描述了一些技术。
你将学到什么
- 了解有关数据准确性及其后果的问题
- 使用易于理解的语言和示例,开发所需的数学基础,以帮助最小化问题的影响
- 使用各种工具和技术,如机器学习算法,区块链和卡尔曼滤波器来解决准确性问题
本书适用于谁
软件开发人员和从业人员,执业工程师,好奇的经理,研究生和研究学者
目录
Chapter 1: The Big Data Phenomenon
Chapter 2: Veracity of Web Information
Chapter 3: Approaches to Establishing Veracity of Big Data
Chapter 4: Change Detection Techniques
Chapter 5: Machine Learning Algorithms
Chapter 6: Formal Methods
Chapter 7: Medley of More Methods
Chapter 8: The Future: Blockchain and Beyond
微信公众号