首页手记算法和数据结构-符号表及其基本实现

算法和数据结构-符号表及其基本实现

标签：

算法

前面几篇文章介绍了基本的排序算法，排序通常是查找的前奏操作。从本文开始介绍基本的查找算法。

在介绍查找算法，首先需要了解符号表这一抽象数据结构，本文首先介绍了什么是符号表，以及这一抽象数据结构的的API，然后介绍了两种简单的符号表的实现方式。

一符号表

在开始介绍查找算法之前，我们需要定义一个名为符号表（Symbol Table）的抽象数据结构，该数据结构类似我们再C#中使用的Dictionary，他是对具有键值对元素的一种抽象，每一个元素都有一个key和value，我们可以往里面添加key，value键值对，也可以根据key来查找value。在现实的生活中，我们经常会遇到各种需要根据key来查找value的情况，比如DNS根据域名查找IP地址，图书馆根据索引号查找图书等等：

为了实现这一功能，我们定义一个抽象数据结构，然后选用合适的数据结构来实现：

public class ST<Key, Value>

ST()	创建一个查找表对象
void Put(Key key, Value val)	往集合中插入一条键值对记录，如果value为空，不添加
Value Get(Key key)	根据key查找value，如果没找到返回null
void Delete(Key key)	删除键为key的记录
boolean Contains(Key key)	判断集合中是否存在键为key的记录
boolean IsEmpty()	判断查找表是否为空
int Size()	返回集合中键值对的个数
Iterable<Key> Keys()	返回集合中所有的键

二实现

1 使用无序链表实现查找表

查找表的实现关键在于数据结构的选择，最简单的一种实现是使用无序链表来实现，每一个节点记录key值，value值以及指向下一个记录的对象。

如图，当我们往链表中插入元素的时候，从表头开始查找，如果找到，则更新value，否则，在表头插入新的节点元素。

实现起来也很简单：

<TKey>{    length = 0;    first;    Node    {        ; }        ; }        ; }        next)        {            .key = key;            .value = value;            .next = next;        }    }    TValue Get(TKey key)    {        TValue result = (TValue);        temp = first;        )        {            (temp.key.Equals(key))            {                result = temp.value;                ;            }            temp = temp.next;        }        result;    }    Put(TKey key, TValue value)    {        temp = first;        )        {            (temp.key.Equals(key))            {                temp.value = value;                ;            }            temp = temp.next;        }        first = (key, value, first);        length++;    }    ....}

分析：

从图或者代码中分析可知，插入的时候先要查找，如果存在则更新value，查找的时候需要从链表头进行查找，所以插入和查找的平均时间复杂度均为O(n)。那么有没有效率更好的方法呢，下面就介绍二分查找。

2 使用二分查找实现查找表

和采用无序链表实现不同，二分查找的思想是在内部维护一个按照key排好序的二维数组，每一次查找的时候，跟中间元素进行比较，如果该元素小，则继续左半部分递归查找，否则继续右半部分递归查找。整个实现代码如下：

<TKey>{    TKey[] keys;    TValue[] values;    length;    INIT_CAPACITY = 2;    capacity)    {        keys = TKey[capacity];        values = TValue[capacity];        length = capacity;    }    (INIT_CAPACITY)    {    }    /// <summary>    /// 根据key查找value。    首先查找key在keys中所处的位置，如果在length范围内，且存在该位置的值等于key，则返回值    否则，不存在    /// </summary>    /// <param name="key"></param>    /// <returns></returns>    TValue Get(TKey key)    {        i = Rank(key);        (i < length && keys[i].Equals(key))            values[i];        else            return default(TValue);    }    /// <summary>    /// 向符号表中插入key，value键值对。    如果存在相等的key，则直接更新value，否则将该key，value插入到合适的位置    1.首先将该位置往后的元素都往后移以为    2.然后再讲该元素放到为i的位置上    /// </summary>    /// <param name="key"></param>    /// <param name="value"></param>    Put(TKey key, TValue value)    {        i = Rank(key);        (i < length && keys[i].Equals(key))        {            values[i] = value;            ;        }        //如果长度相等，则扩容        (length == keys.Length) Resize(2 * keys.Length);         j = length; j > i; j--)        {            keys[j] = keys[j - 1];            values[j] = values[j - 1];        }        keys[i] = key;        values[i] = value;        length++;    }    /// <summary>    /// 返回key在数组中的位置    /// </summary>    /// <param name="key"></param>    /// <returns></returns>    Rank(TKey key)    {        lo = 0;        hi = length - 1;        (lo <= hi)        {            mid = lo + (hi - lo) / 2;            (key.CompareTo(keys[mid]) > 0) lo = mid + 1;            (key.CompareTo(keys[mid]) < 0) hi = mid - 1;            mid;        }        lo;    }    。。。}

这里面重点是Rank方法，我们可以看到首先获取mid位置，然后将当前元素和mid位置元素比较，然后更新lo或者hi的位置用mid来替换，如果找到相等的，则直接返回mid，否则返回该元素在集合中应该插入的合适位置。上面是使用迭代的方式来实现的，也可以改写为递归：

hi){    lo;    mid = lo + (hi - lo) / 2;    (key.CompareTo(keys[mid]) > 0)        Rank(key, mid + 1, hi);    (key.CompareTo(keys[mid]) < 0)        Rank(key, lo, hi - 1);    else        return mid;}

二分查找的示意图如下：

分析：

使用有序的二维数组来实现查找表可以看出，采用二分查找只需要最多lgN+1次的比较即可找到对应元素，所以查找效率比较高。

但是对于插入元素来说，每一次插入不存在的元素，需要将该元素放到指定的位置，然后，将他后面的元素依次后移，所以平均时间复杂度O(n)，对于插入来说效率仍然比较低。

三总结

本文介绍了符号表这一抽象数据结构，然后介绍了两种基本实现：基于无序链表的实现和基于有序数组的实现，两种实现的时间复杂度如下：

可以看到，使用有序数组的二分查找法提高了符号表的查找速度，但是插入效率仍旧没有得到提高，而且在要维护数组有序，还需要进行排序操作。这两种实现方式简单直观，但是无法同时达到较高查找和插入效率。那么有没有一种数据结构既能够在查找的时候有较高的效率，在插入的时候也有较好的效率呢，本文只是一个引子，后面的系列文章将会介绍二叉查找树，平衡查找树以及哈希表。

希望本文对您了解查找表的基本概念以及两种基本实现有所帮助。

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕后森

手记
篇

粉丝

59

获赞与收藏

239

关注作者，订阅最新文章

阅读免费教程

Python 算法入门教程

15个小节 30715 1187

算法入门教程

15个小节 33809 719

后端通用面试教程

41个小节 33075 374

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

算法和数据结构-符号表及其基本实现

一符号表

二实现

1 使用无序链表实现查找表

2 使用二分查找实现查找表

三 总结

阅读免费教程

三总结