时间:2021-12-17|浏览:7336
用戶喜愛的交易所
已有账号登陆后会弹出下载
随着物联网和移动通信技术的快速发展,数据呈爆炸性增长,人类进入了大数据时代。在大数据的背景下,数据本身的固有或潜在价值使其成为重要的资产,可分为两类:一类是直接输入的原始收集数据,另一类是从这些原始数据中衍生出来的数据。其中,后者在生活中很常见,它们通常经过一系列的处理,如复制粘贴、各种转换和修改等[1]。由于中间过程尚不清楚,用户在需要特定数据时无法判断其来源和可靠性。事实上,衍生数据可能存在错误,或者由于某些人的利益被非法篡改,甚至与原始数据无关,突出了追踪此类数据来源以提供信任的需求。
数据完整性验证在创建对上述数据的信任中起着重要作用,因为在这种情况下,只有未更改的数据是有效的,所以值得信赖。一种常用的验证方法是,如果数据在存储或处理后保持不变,则在保存或处理前计算数据的密码哈希值。哈希值是保密的还是公开的取决于它的用途,然后将结果与以前存储的散列进行比较,以证明数据的完整性。如果两个哈希值相同,数据可以被视为有效和可信的。
哈希算法的特点是不同数据产生的哈希值也不同。然而,中国密码学家王晓云发表了如何破解 MD5 和其它哈希函数”一文表明存在“哈希冲突”问题[2],即不同的输入产生同一个哈希值,使得攻击者能够改变数据,且仍然确保哈希值保持不变。在这种情况下,即使数据已被更改,也会将数据视为有效。随着计算能力的不断提高,当前的哈希算法如 SHA256 或 SHA512 研究表明是不安全的[3,4]。提供数据或哈希信任的扩展方法是使用数字签名。签名允许发送人证明数据是由自己发送的,因此数据可能被认为是可靠的;但也存在安全风险,即如果数据内容被恶意拦截,修改原始数据内容并签名,接收人仍可通过验证。这些方法不足以提供防篡改数据。