物联网数据存储和保留的挑战
物联网(Internet
of
Things,简称IoT)的发展使得大量的数据被不断地生成、存储和分析。这些数据包含了设备的运行状态、环境信息等多种有价值的信息。然而,物联网数据存储和保留的过程中面临着诸多挑战。以下是一些主要的挑战:
物联网设备收集的数据中可能包含敏感信息,如受保护的健康信息(PHI)。保护这些数据免受攻击是物联网设备面临的共同挑战。由于物联网设备通常使用默认的、弱的和硬编码的密码、密钥或机密进行部署,网络犯罪分子可以利用这种糟糕的密码安全性来访问这些设备,从而访问这些设备以及他们收集和处理的数据。此外,物联网设备通常在“设置好后不用管”的基础上部署,没有为新发现的漏洞应用补丁,这使得许多物联网设备都包含攻击者可以利用的漏洞。
物联网设备收集和处理的大部分信息可能受到各种数据隐私法的保护。例如,美国健康保险便携性和可访问性法案(HIPAA)保护IoMT设备将收集的PHI类型。除了保护此受保护数据免受攻击外,物联网设备制造商和用户还必须根据适用法律对其进行保护。一些重要的考虑因素包括:同意收集、加密和管辖权等。
物联网设备正在滚雪球般发展,物联网设备产生大量数据。2019年,物联网设备产生的数据估计为18.3兆字节,预计到2025年将增长到73.1兆字节。物联网设备产生的海量数据将其存储、传输和处理变成了重大挑战。物联网设备通常部署在互联网带宽有限的偏远地区,这使得传输收集到的数据变得困难且通常成本高昂。
许多物联网设备旨在采用大数据思维。这使得数据量和复杂性的结合,使得难以有效和高效地处理来自物联网设备的数据。许多旨在管理复杂数据集的工具无法处理物联网设备产生的数据量。另一方面,能够处理大量数据的解决方案可能无法提供所需的深度分析水平,也可能无法满足物联网设备的延迟要求。
由于物联网数据的特性,如高并发的写入吞吐、高效的时序数据查询分析、低成本的时序数据存储等,这就需要有针对性的存储解决方案。例如,某典型的车联网场景,仅20000辆车每小时就产生近百GB的车辆指标数据,如果要保存一年的运行数据就需要PB级的数据存储规模。
物联网数据的存储和保留还需要解决一系列技术挑战,如高并发的写入吞吐、高效的数据TTL机制、多维时间线检索、流式处理、预计算等。此外,时序数据存储需要充分利用好时序数据量大、冷热访问特征明显、做好计算、存储资源的解耦,通过低成本存储介质、压缩编码、冷热分离、高效TTL、Servereless等技术将数据存储成本降低到极致。
综上所述,物联网数据存储和保留的挑战主要涉及到数据安全、数据隐私、数据量、数据复杂性、数据存储和保留的成本以及技术挑战等方面。随着技术的发展,这些挑战将会逐渐得到解决。