论文研读与思考|MCSE:支持丰富搜索功能的安全多字符可搜索加密

admin 2026-03-05 19:45:09 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文研读了一种安全多字符可搜索加密方案MCSE。针对现有方案易受攻击、存在误报及功能受限问题,MCSE引入随机化-填充模型增强安全,采用完整特征提取与向量空间模型消除误报,并支持通配符与逻辑搜索。实验显示其计算效率极高,适用于静态数据高精度检索,但存储开销较大且不支持动态更新。 综合评分: 88 文章分类: 数据安全,云安全,解决方案


cover_image

论文研读与思考|MCSE:支持丰富搜索功能的安全多字符可搜索加密

Yue Yue

玄枢战队-Arcane Hub

2026年3月4日 20:33 陕西

原文题目:Secure Multi-Character Searchable Encryption Supporting Rich Search Functionalities

原文作者:Qing Wang;Donghui Hu;Meng Li;Yan Qiao;Guomin Yang;Mauro Conti

一、主要研究问题、目标和方法

1.1 核心研究问题和研究动机

通配符关键词可搜索加密(WKSE)技术是将每个关键词拆分为多个字符映射到布隆过滤器,用户可使用通配符的搜索表达式来检索加密数据。其中,单字符通配符“?”表示任意单个字符,多字符通配符“*”表示任意字符序列。然而,现有WKSE方案存在三个主要问题:

①易受相关性攻击

布隆过滤器的安全性较弱,容易受到相关性攻击,攻击者可通过比较不同关键词对应布隆过滤器的重叠部分来推断关键词间的相似性。

②存在误报问题

特征提取策略不完整,可能导致不同关键词或表达式拥有相同的特征集。同时,布隆过滤器因哈希冲突而固有地存在误报率,这些误报会导致错误的搜索结果和判断。

③搜索功能灵活性不足

缺乏对包含“与”、“或”、“非”操作的逻辑表达式的搜索,这使得用户进行复杂的模式匹配搜索时效率低下且不便。

因此,研究的核心目标是设计一种新的可搜索加密方案,它能够有效抵御相关性攻击,彻底消除误报,并通过支持包含“与”、“或”、“非”等操作的逻辑表达式搜索,提供强大而灵活的搜索功能。

1.2 提出的关键方法、模型或理论框架

论文提出了一种多字符可搜索加密(MCSE)的新方案,分别在安全性、准确性以及功能性方面进行设计:

1.安全性

为抵御相关性攻击并确保关键词信息的机密性,方案在索引构建阶段引入了随机化-填充模型。该模型首先对特征向量进行随机化处理,之后再进行填充加密,以确保针对同一份索引、由不同陷门触发的计算结果互不相同,从而有效防止攻击者通过比对结果推断关键词间的关联。

该方法只需要增加一个填充维度,在显著提升安全性的同时,将计算与通信开销控制在较低水平。

2.准确性

为彻底消除误报,方案设计了完整的特征提取策略。该策略不仅提取关键词或表达式中每个字符及其精确位置信息,还提取其整体长度等特征。这种包含字符、位置、长度的多维特征集能为每个关键词或表达式生成全局唯一的表征。

方案还采用向量空间模型替代布隆过滤器,将特征集映射为二值向量。两者结合,从根源上杜绝了因特征重复或哈希冲突导致的误报。

3.功能性

为支持灵活的多字符与逻辑搜索,方案为关键词表达式、通配符表达式及逻辑表达式分别定制了特征提取方法。

对于前两者,统一提取字符、位置及长度特征。对于逻辑表达式,比如“(abc)”表示“或”,“[abc]”表示“非”,方案将每个逻辑运算符及其管辖范围内的字符视为一个独立单元进行处理,赋予单元内字符相同的位置标识,并同样提取字符、位置及长度特征,从而实现了对复杂逻辑搜索语义的支持。

二、具体方案研究及总结

2.1 方案模型

图1 系统模型

如图1所示,MCSE系统模型包含三个实体:云服务器CS、数据所有者DO和数据用户DU。

| | | | — | — | | 实体 | 说明 | | 云服务器CS | 诚实但好奇,可能会尝试从索引、后门及类似内积中获取文件和关键词的有用信息,但绝不会偏离协议 | | 数据所有者DO | 个人或企业,负责建立索引,也可以搜索文件并授权其他用户搜索 | | 数据用户DU | 可通过DO提供的密钥生成陷门来搜索目标文件 |

由四个算法组成,具体内容如下:

(1)Setup: DO在这一阶段选择加密所需的密钥。

(2)IndexBuild: DO从文件中提取关键词,并基于关键词与文件的对应关系构建加密索引。随后,将加密后的文件本身与构建好的索引一并上传至CS。

(3)Trapdoor:当DU需要搜索包含特定表达式的文件时,其首先向DO发送搜索请求。若获得授权,DO会通过安全通道将密钥发送给DU。DU使用此密钥生成一个称为“陷门”的搜索令牌,并将其发送给CS。

(4)Search: CS在接收到陷门后,使用该陷门在所有索引中进行检索,找出匹配的文件,并将这些文件返回给DU。

2.2 核心框架

论文提出的MCSE方案是基于E-MRSE架构。E-MRSE是一种增强的多维范围可搜索加密框架,其核心思想是将搜索条件编码为多维向量,并通过加密向量间的内积运算来实现匹配判断。

图2 矢量处理系统

如图2所示,相比于MRSE-1和MRSE-2,E-MRSE在向量填充加密前,对原始向量进行了随机化处理,这一步骤确保了即使对于相同的输入,生成的加密向量也各不相同且看似随机,从而再安全性和效率之间取得了更好的平衡,为MCSE抵御攻击提供了基础。

在E-MRSE框架内,MCSE通过三大关键技术设计来实现其目标:

①采用随机化-填充模型处理特征向量,有效防止攻击者通过比较索引或陷门推断信息关联,以此抵御相关性攻击。

②设计完整的特征提取策略,为每个关键词或表达式生成包含字符、精确位置和长度的全局唯一特征集,并采用向量空间模型替代布隆过滤器,从根源上消除误报。

③为关键词、通配符和逻辑表达式分别定制特征提取方法,比如将逻辑运算符及其管辖字符视为整体单元处理,从而统一支持丰富的搜索模式。

最终,用户可以通过多样化的表达式进行索引检索,其整体架构如图3所示。

图3 MCSE框架

2.3 作者得出的关键结论及贡献

•MCSE算法具有抗相关攻击和隐藏通配符位置的特性,通过安全证明,MCSE算法在能捕捉相关攻击的特征选择攻击下是安全的。

•MCSE无误报,设计了完整的特征提取策略,并应用向量空间模型,使得任何向量都能唯一确定一个关键词或表达式。

•MCSE支持关键字、通配符和逻辑表达式搜索。设计了三种特征提取策略,这些策略使索引能够适应多种表达式的搜索需求。

•与现有算法相比,实验结果表明,MCSE算法在搜索过程中节省了约99.87%的计算量。

2.4 与现有方案的比较

作者将MCSE方案与现有的一些研究从关键词表达式、通配符表达式、逻辑表达式、无假阳性、抗相关性攻击和不透露通配符的位置这6个方面进行比较,如表1所示。

[10] T. Suga, T. Nishide, and K. Sakurai, “Secure keyword search using bloom filter with specified character positions,” in Proc. 6th Int. Conf. Provable Secur., 2012, pp. 235–252.

[22] C. Hu, L. Han, and S. M. Yiu, “Efficient and secure multi-functional searchable symmetric encryption schemes,” Secur. Commun. Netw., vol. 9, no. 1, pp. 34–42, 2016.

[11] J. Hua, Y. Liu, H. Chen, X. Tian, and C. Jin, “An enhanced wildcard-based fuzzy searching scheme in encrypted databases,” World Wide Web, vol. 23, no. 3, pp. 2185–2214, 2020.

[17] Y. Li, J. Ning, and J. Chen, “Secure and practical wildcard searchable encryption system based on inner product,” IEEE Trans. Serv. Comput., vol. 16, no. 3, pp. 2178–2190, May/Jun. 2023.

[18] Q. Wang, D. Hu, M. Li, and G. Yang, “Secure and flexible wildcard queries,” IEEE Trans. Inf. Forensics Secur., vol. 19, pp. 7374–7388, 2024.

[23] C. Hahn, “Towards secure and efficient wildcard search for cloud storage,”IEEE Trans. Dependable Secure Comput., vol. 22, no. 6, pp. 6968–6982,Nov./Dec. 2025.

三、研究方法与性能评估

3.1 研究设计与实验设置

所有实验均在搭载第11代英特尔酷睿i5-1135 G7处理器的计算机上完成,系统运行Windows11 64位操作系统。算法全部采用Java语言编写,通过JPBC 库实现SFWQ与SPWSE中涉及的群运算及双线性对操作。

3.2 数据收集方法及数据集

研究选用Enron电子邮件数据集和学术论文摘要数据集作为基准。将每封电子邮件和每篇论文的摘要视为独立文件,并将文件内容作为关键词集合进行处理和分析。

3.3 实验分析

(1)索引构建开销

索引构建分为特征提取、向量转换、向量处理和索引加密四个阶段。前两个阶段统称未索引生成过程,后两个阶段统称为索引加密过程。如图4(a)所示,MCSE的索引生成时间与数据集中的关键词数量呈近似线性关系。

图4

从(b)中可以看出,加密时间与关键词数量几乎呈线性关系。索引加密所需时间预期高于索引生成时间,但加密过程使MCSE能够抵御相关性攻击。

图5

从图5得出,最长关键词长度ML会直接影响特征向量维度,从而对索引生成和加密时间阐述线性及近似平方的影响。

与其他方案进行比较,具体结果如图6,MCSE的时间成本极低且性能优异。

图6

(2)陷门生成与搜索开销

方案支持关键词表达式KE、单字符通配符表达式Swe、逻辑表达式LE和多字符通配符表达式MWE,1MWE表示包含一个多字符通配符,2MWE表示包含两个多字符通配符。表V中给出了对应生成陷门的时间成本。

图7展示了MCSE算法效率随关键词数量变化的规律。KE、SW、LEW和1MWE四种表达式的搜索时间基本一致,呈现近似线性关系。当数据集包含600个关键词时,这四种表达式的搜索时间均控制在11毫秒以内。对于2MWE表达式,其搜索时间仍与关键词数量保持线性关联,当数据集包含600个关键词时,搜索时间约为64毫秒。

图7

(3)与SPWSE和SEWQ对比

如图8(a)所示,随着关键词数量增加,MCSE的总索引构建时间增长平缓,显著优于基于双线性对复杂运算的SPWSE和TSEWS方案。

图8

(b)中可以看出,MCSE的搜索时间随关键词数量线性增长,但基数极小。与需要为每个索引调整陷门的SFWQ方案相比,当数据集含600个关键词时,MCSE节省了约99.87%的搜索时间,优势极其显著。

表VI中,MCSE在索引和陷门的通信开销上均低于SPWSE和SFWQ。虽然略高于TSEWS,但这是为了支持更丰富的搜索功能所做出的合理权衡。

3.4 理论分析

论文中通过形式化的选择关键词攻击模型对MCSE方案进行了安全性证明,表明在诚实但好奇的云服务器模型下,能够满足关键词的语义安全,并能抵御文档中提到的相关性攻击。

从理论上分析了完整特征提取策略与向量空间模型如何保证搜索结果的完全准确。

四、论文的局限性、未来方向及适用范围

4.1 研究的不足与限制因素

为了追求零误报和强大的搜索功能,方案采用了完整的特征提取和向量空间模型,这导致了比基于布隆过滤器的方案存在更大的索引存储开销。

论文的方案主要侧重于静态加密数据集的搜索。在实际应用中,数据是动态的,需要频繁地添加或者删除文件及其关键词,方案未讨论如何在动态环境下,高效、安全地更新已构建的加密索引,可能会限制在需要实时数据操作的场景中的应用。

4.2 未来研究方向

研究更高效的特征压缩方法或更简洁的向量表示,以降低索引的存储与通信开销,提升方案的整体效率;结合实际情况,设计一种支持高效动态操作的MCSE扩展方案,使其能更好地适应云存储的实际环境。

4.3 研究结果的适用范围

该方案的研究成果主要适用于对搜索准确性、功能丰富性和模式隐私保护有较高要求的场景,像一些需要对加密的企业文档、法律档案或医疗记录进行复杂模式匹配的检索系统,以及任何不能接受误报干扰,且需防止攻击者通过搜索模式推断关键词关联性的高安全性云存储应用。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:玄枢战队-Arcane Hub Yue Yue《论文研读与思考|MCSE:支持丰富搜索功能的安全多字符可搜索加密》

评论:0   参与:  0