摘要:树的基本概念、二叉树、树和森林、树与二叉树的应用。
树的基本概念
树的定义
树是一种非线性的数据结构。树是若干结点的集合,是由唯一的根和若干棵互不相交的子树组成的。其中每一棵子树又是一棵树,也是唯一的根节点和若干互不相交的子树组成的。由此可见树的定义是递归的。其中需要注意的是结点数为0的树称为空树。
树的基本术语
结点:A、B、C等都是结点,结点不仅包含数据,而且包含指向子树的分支。
结点的度:结点拥有的子树个数或者分支的个数。例如A结点有3棵子树,所以A的结点的度为3。
树的度:树中个结点度的最大值。
叶子结点:指度为0的结点。
非终端结点:指度不为0的结点,除了根结点之外的非终端结点,也叫作内部节点。
孩子:结点的子树的根,如A结点的孩子就是B、C、D
双亲:与孩子定义对应,如B、C、D的双亲就是A
兄弟:同一个双亲的孩子之间互为兄弟,如B、C、D互为兄弟。
祖先:从根到某个结点的路径上的所有结点,都是这个结点的祖先。如K的祖先是A、B、E
子孙:以某个结点为根的子树中的所有结点,都是该结点的子孙,如D的子树为H、I、J、M
层次:从根开始,根为第一次,根的孩子为第二次,以此类推
树的高度(深度):树中结点的最大层次。
结点的高度(深度):从根节点到该节点路径上的结点个数
堂兄弟:双亲在同一层的结点互为堂兄弟,如G和H互为堂兄弟。
有序树:树中的结点的子树从左到右是有次序的,不能交换,这样的树叫做有序树
无序树:树中结点的子树没有顺序,可以任意次交换。
丰满树:丰满树即为了理想平衡树,要求除去最底层外,其他层都是满的
森林:若干互不相交的树的集合,例如把A去掉,则剩下的三个子树互不相交,构成一个森林。
树的存储结构
1.顺序存储结构
树的顺序存储结构中最直观的是双亲存储的结构,用以为数组即可实现。int tree[maxSize]
。数组下标表示树中的结点,数组元素的内容表示该结点的双亲结点,这样就可以表示一棵树了。
2.链式存储结构
(1)孩子存储结构
孩子存储结构实质上就是图的邻接表存储结构,树是一种特殊的图,把图中多对多的关系改为一对多即可得到树。
(2)孩子兄弟存储结构
孩子兄弟存储结构与树和森林和二叉树的相互转换关系密切。
二叉树的定义
将一般的树加上下面两个限制即可得到二叉树:
1.每个结点最多只有两个子树
2.子树有左右顺序之分
所有的分支结点都有左右孩子结点及并且叶子结点都集中在二叉树的最下一层,这样的二叉树称为满二叉树。对满二叉树进行编号,如果个结点编号与次深度相同的满二叉树相同位置的结点编号钧相同,则为完全二叉树
二叉树的主要性质
1.非空二叉树上叶子结点数等于双分支结点数+1
2.二叉搜索的第i层上最多有2^(i-1)个结点。(i>=1)
3.高度为k的二叉树最多有2^k - 1个结点。
其他待补充……
二叉树的存储结构
1.顺序存储结构
2.链式存储结构
1 | typedef struct BTNode |
二叉树的遍历算法
先序遍历
访问根节点–>先序遍历左子树–>先序遍历右子树
1 | void preorder(BTNode *p) |
中序遍历
中序遍历左子树–>访问根节点–>中序遍历右子树
1 | void inorder(BTNode *p) |
后序遍历
后序遍历左子树–>后序遍历右子树–>访问根节点
1 | void postorder(BTNode *p) |
二叉树的深度
1 | int get_tree_depth(BTNode *root) |
层次遍历
按照层次进行遍历输出,需要建立一个循环队列。先将二叉树的头结点入队,然后出队列,访问该节点。如果左子树存在则左子树根节点入队,如果右子树存在则右子树根节点入队,然后出队列,对结点进行访问。如此反复直到队列为空。
1 | //层次遍历 |
创建二叉树
二叉树以链表的形式存储
1 |
|
二叉树遍历算法的改进
二叉树的深度优先遍历算法都是用递归函数实现的,效率低下。原因是因为相当于调用一个栈并做了诸如保护线程和恢复现场等复杂操作,才使得代码简短。可以采用二叉树深度优先遍历算法的非递归实现和线索二叉树。
- 二叉树深度优先遍历算法是用用户自定义的栈来代替系统栈,也就是用非递归的方式来实现遍历算法。
- 线索二叉树是将二叉树线索化,不需要栈来辅助完成遍历操作,更进一步提高效率。
二叉树深度优先遍历算法的非递归实现
先序遍历的非递归算法
将出栈的结点的孩子依照右孩子先入栈,左孩子后入栈的顺序入栈。
1 | //非递归先序遍历 |
中序遍历的非递归算法
入栈时左孩子存在则继续入栈
左孩子不存在则栈顶出栈,出栈元素右孩子存在则入栈
tip:会存在栈空但是遍历未结束的情况,所以判断条件不能像先序遍历那样使用top!=-1
来判断,需要使用top!=-1 ||p!=NULL
进行判断。
1 | //非递归中序遍历 |
后序遍历的非递归算法
先序遍历序列:A B D E C F
后序遍历序列:D E B F C A
后序遍历逆序:A C F B E D
观察发现,逆后序遍历和先序遍历存在一点联系,逆后序遍历序列只不过是先序遍历过程中对左右子树遍历顺序交换所得到的结果
只需要将先序遍历的左右子树遍历的顺序交换遍历方式并将遍历结果压入栈即可得到后序遍历序列。
1 | //非递归后序遍历 |
完成代码
1 |
|
线索二叉树
二叉树非递归算法避免了系统栈的调用,提高了一定的执行效率。而线索二叉树可以将用户栈也省掉,把二叉树的遍历过程线性化,进一步提高效率。
二叉树线索化后进士于一个线性结构,分支结构的遍历操作就转化为近似于线性结构的遍历操作,通过线索的辅助使得寻找当前结点前驱或者后继的平均效率大大提高。
线索二叉树的构造
在二叉树线索化的时候会把树中的空指针利用起来作为寻找当前结点的前驱或者后继的线索,这样就出现一个问题,即线索和树中原有的孩子结点的指针无法区别。上面的设计是为了区分两类指针,其中ltag和rtag为标识域,具体意义为:
1)如果 ltag=0,表示lchild为指针,指向左孩子。如果ltag=1,表示lchild为线索,指向结点的直接前驱。
2)如果 rtag=0,表示rchild为指针,指向右孩子。如果rtag=1,表示rchild为线索,指向结点的直接后继。
二叉树中序线索化
有待更新
哈夫曼树
哈夫曼树也叫最优二叉树,是一类带权路径最短的树,广泛应用于查找(将更经常使用的结点放在树顶,更少使用的放在叶子结点,这也是哈夫曼编码的优点)