AS-Index: A Structure for String Search Using n-Grams and Algebraic Signatures

2016 
我们在场当索引,为在磁盘居民数据库的准确字符串搜索的新索引结构。当索引依靠古典转换文件结构,其主要革新基于为 n 克哈希和模式搜索使用的代数学的签名的性质是概率的搜索。明确地,我们的签名的性质允许由仅仅检查二张张贴的表执行搜索。算法因此享受要求磁盘存取的一个经常的数字的唯一的特征,独立地,从两个,模式尺寸和数据库缩放。我们在大数据集上进行广泛的实验评估我们的索引行为。他们证实获得张贴的表稳定地提供与必要的二磁盘存取成正比的搜索表演。这为在大文本的数据库要求很快的查找的应用的班使我们的结构成为兴趣的一种选择。我们描述索引结构,我们代数学的签名的使用,和搜索算法。我们基于影响我们的结构的行为的参数讨论运作的交易,并且介绍理论、试验性的性能分析。我们下次把当索引与最先进的选择作比较并且显示出那 1 )它的构造时间匹配它的竞争者的由于结构的类似, 2 )至于搜索时间,它常常超过标准途径由于签名计算补充的数据的节俭的存取,它在我们的搜索方法的核心。
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []