现在的位置: 首页 > 综合 > 正文

MySQL 所推荐的左右值法(毗邻目录法、预排序历遍法)

2013年09月09日 ⁄ 综合 ⁄ 共 10618字 ⁄ 字号 评论关闭

毗邻目录法:

这种方法说白了就是子类,依赖父类,父类依赖爷爷类,爷爷类可以有多个儿子类,跟父类平级的类。一层一层的。

预排序历遍法:

这种算法比较高端,使用的是mysql官方推荐的左右算法。


使用场合:多级目录,多层关联的情况。

而我的使用场合就是典型的省市县3级关联。下面先来简单了解下它们的原理。

关于省市县的文章以后有空再放出。


以下3篇文章分别摘自互联网。都是3位前辈的分析,可以学习之。


一、引言

产品分类,多级的树状结构的论坛,邮件列表等许多地方我们都会遇到这样的问题:如何存储多级结构的数据?在PHP的应用中,提供后台数据存储的通常是关系型数据库,它能够保存大量的数据,提供高效的数据检索和更新服务。然而关系型数据的基本形式是纵横交错的表,是一个平面的结构,如果要将多级树状结构存储在关系型数据库里就需要进行合理的翻译工作。接下来我会将自己的所见所闻和一些实用的经验和大家探讨一下:
层级结构的数据保存在平面的数据库中基本上有两种常用设计方法:

  • 毗邻目录模式(adjacency list model)
  • 预排序遍历树算法(modified preorder tree traversal algorithm)

我不是计算机专业的,也没有学过什么数据结构的东西,所以这两个名字都是我自己按照字面的意思翻的,如果说错了还请多多指教。这两个东西听着好像很吓人,其实非常容易理解。

二、模型
这里我用一个简单食品目录作为我们的示例数据。
我们的数据结构是这样的,以下是代码:

  1. Food
  2. |
  3. |---Fruit
  4. | |
  5. | |---Red
  6. | | |
  7. | | |--Cherry
  8. | |
  9. | +---Yellow
  10. | |
  11. | +--Banana
  12. |
  13. +---Meat
  14. |--Beef
  15. +--Pork

复制代码

为了照顾那些英文一塌糊涂的PHP爱好者

  1. Food : 食物
  2. Fruit : 水果
  3. Red : 红色
  4. Cherry: 樱桃
  5. Yellow: 黄色
  6. Banana: 香蕉
  7. Meat : 肉类
  8. Beef : 牛肉
  9. Pork : 猪肉

复制代码

三、实现

1、毗邻目录模式(adjacency list model)

这种模式我们经常用到,很多的教程和书中也介绍过。我们通过给每个节点增加一个属性 parent 来表示这个节点的父节点从而将整个树状结构通过平面的表描述出来。根据这个原则,例子中的数据可以转化成如下的表:
以下是代码:

  1. +-----------------------+
  2. | parent | name |
  3. +-----------------------+
  4. | | Food |
  5. | Food | Fruit |
  6. | Fruit | Green |
  7. | Green | Pear |
  8. | Fruit | Red |
  9. | Red | Cherry |
  10. | Fruit | Yellow |
  11. | Yellow | Banana |
  12. | Food | Meat |
  13. | Meat | Beef |
  14. | Meat | Pork |
  15. +-----------------------+

复制代码

我们看到 Pear 是Green的一个子节点,Green是Fruit的一个子节点。而根节点'Food'没有父节点。 为了简单地描述这个问题, 这个例子中只用了name来表示一个记录。 在实际的数据库中,你需要用数字的id来标示每个节点,数据库的表结构大概应该像这样:id, parent_id, name, descrīption。
有了这样的表我们就可以通过数据库保存整个多级树状结构了。

显示多级树,如果我们需要显示这样的一个多级结构需要一个递归函数。
以下是代码:
[php]
< ?php
// $parent is the parent of the children we want to see
// $level is increased when we go deeper into the tree,
// used to display a nice indented tree
function display_children($parent, $level) {
// 获得一个 父节点 $parent 的所有子节点
$result = mysql_query("
SELECT name
FROM tree
WHERE parent = '" . $parent . "'
;"
);
// 显示每个子节点
while ($row = mysql_fetch_array($result)) {
// 缩进显示节点名称
echo str_repeat(' ', $level) . $row['name'] . "\n";
//再次调用这个函数显示子节点的子节点
display_children($row['name'], $level+1);
}
}
?>
[/php]

对整个结构的根节点(Food)使用这个函数就可以打印出整个多级树结构,由于Food是根节点它的父节点是空的,所以这样调用: display_children('',0)。将显示整个树的内容:

  1. Food
  2. Fruit
  3. Red
  4. Cherry
  5. Yellow
  6. Banana
  7. Meat
  8. Beef
  9. Pork

复制代码

如果你只想显示整个结构中的一部分,比如说水果部分,就可以这样调用:display_children('Fruit',0);

几乎使用同样的方法我们可以知道从根节点到任意节点的路径。比如 Cherry 的路径是 "Food >; Fruit >; Red"。 为了得到这样的一个路径我们需要从最深的一级"Cherry"开始, 查询得到它的父节点"Red"把它添加到路径中, 然后我们再查询Red的父节点并把它也添加到路径中,以此类推直到最高层的"Food",以下是代码:
[php]<?php
// $node 是那个最深的节点
function get_path($node) {
// 查询这个节点的父节点
$result = mysql_query("
SELECT parent
FROM tree
WHERE name = '" . $node ."'
;"
);
$row = mysql_fetch_array($result);
// 用一个数组保存路径
$path = array();
// 如果不是根节点则继续向上查询
// (根节点没有父节点)
if ($row['parent'] != '') {
// the last part of the path to $node, is the name
// of the parent of $node
$path[] = $row['parent'];
// we should add the path to the parent of this node
// to the path
$path = array_merge(get_path($row['parent']), $path);
}
// return the path
return $path;
}
?>;[/php]
如果对"Cherry"使用这个函数:print_r(get_path('Cherry')),就会得到这样的一个数组了:

  1. Array (
  2. [0] => Food
  3. [1] => Fruit
  4. [2] => Red
  5. )

复制代码

接下来如何把它打印成你希望的格式,就是你的事情了。

缺点:
这种方法很简单,容易理解,好上手。但是也有一些缺点。主要是因为运行速度很慢,由于得到每个节点都需要进行数据库查询,数据量大的时候要进行很多查询才能完成一个树。另外由于要进行递归运算,递归的每一级都需要占用一些内存所以在空间利用上效率也比较低。

2、预排序遍历树算法

现在让我们看一看另外一种不使用递归计算,更加快速的方法,这就是预排序遍历树算法(modified preorder tree traversal algorithm)
这种方法大家可能接触的比较少,初次使用也不像上面的方法容易理解,但是由于这种方法不使用递归查询算法,有更高的查询效率。

我们首先将多级数据按照下面的方式画在纸上,在根节点Food的左侧写上 1 然后沿着这个树继续向下 在 Fruit 的左侧写上 2 然后继续前进,沿着整个树的边缘给每一个节点都标上左侧和右侧的数字。最后一个数字是标在Food 右侧的 18。 在下面的这张图中你可以看到整个标好了数字的多级结构。(没有看懂?用你的手指指着数字从1数到18就明白怎么回事了。还不明白,再数一遍,注意移动你的手指)。
这些数字标明了各个节点之间的关系,"Red"的号是3和6,它是 "Food" 1-18 的子孙节点。 同样,我们可以看到 所有左值大于2和右值小于11的节点 都是"Fruit" 2-11 的子孙节点

以下是代码:

  1. 1 Food 18
  2. |
  3. +------------------------------+
  4. | |
  5. 2 Fruit 11 12 Meat 17
  6. | |
  7. +-------------+ +------------+
  8. | | | |
  9. 3 Red 6 7 Yellow 10 13 Beef 14 15 Pork 16
  10. | |
  11. 4 Cherry 5 8 Banana 9

复制代码

这样整个树状结构可以通过左右值来存储到数据库中。继续之前,我们看一看下面整理过的数据表。

以下是代码:

  1. +----------+------------+-----+-----+
  2. | parent | name | lft | rgt |
  3. +----------+------------+-----+-----+
  4. | | Food | 1 | 18 |
  5. | Food | Fruit | 2 | 11 |
  6. | Fruit | Red | 3 | 6 |
  7. | Red | Cherry | 4 | 5 |
  8. | Fruit | Yellow | 7 | 10 |
  9. | Yellow | Banana | 8 | 9 |
  10. | Food | Meat | 12 | 17 |
  11. | Meat | Beef | 13 | 14 |
  12. | Meat | Pork | 15 | 16 |
  13. +----------+------------+-----+-----+

复制代码

注意:由于"left"和"right"在 SQL中有特殊的意义,所以我们需要用"lft"和"rgt"来表示左右字段。 另外这种结构中不再需要"parent"字段来表示树状结构。也就是 说下面这样的表结构就足够了。

以下是代码:

  1. +------------+-----+-----+
  2. | name | lft | rgt |
  3. +------------+-----+-----+
  4. | Food | 1 | 18 |
  5. | Fruit | 2 | 11 |
  6. | Red | 3 | 6 |
  7. | Cherry | 4 | 5 |
  8. | Yellow | 7 | 10 |
  9. | Banana | 8 | 9 |
  10. | Meat | 12 | 17 |
  11. | Beef | 13 | 14 |
  12. | Pork | 15 | 16 |
  13. +------------+-----+-----+

复制代码

好了我们现在可以从数据库中获取数据了,例如我们需要得到"Fruit"项下的所有所有节点就可以这样写查询语句:

  1. SELECT * FROM tree WHERE lft BETWEEN 2 AND 11;

复制代码

这个查询得到了以下的结果。

以下是代码:

  1. +------------+-----+-----+
  2. | name | lft | rgt |
  3. +------------+-----+-----+
  4. | Fruit | 2 | 11 |
  5. | Red | 3 | 6 |
  6. | Cherry | 4 | 5 |
  7. | Yellow | 7 | 10 |
  8. | Banana | 8 | 9 |
  9. +------------+-----+-----+

复制代码

看到了吧,只要一个查询就可以得到所有这些节点。为了能够像上面的递归函数那样显示整个树状结构,我们还需要对这样的查询进行排序。用节点的左值进行排序:

  1. SELECT * FROM tree WHERE lft BETWEEN 2 AND 11 ORDER BY lft ASC;

复制代码

剩下的问题如何显示层级的缩进了。
以下是代码:
[php]
< ?php
function display_tree($root) {
// 得到根节点的左右值
$result = mysql_query("
SELECT lft, rgt
FROM tree
WHERE name = '" . $root . "'
;"
);
$row = mysql_fetch_array($result);
// 准备一个空的右值堆栈
$right = array();
// 获得根基点的所有子孙节点
$result = mysql_query("
SELECT name, lft, rgt
FROM tree
WHERE lft BETWEEN '" . $row['lft'] . "' AND '" . $row['rgt'] ."'
ORDER BY lft ASC
;"
);
// 显示每一行
while ($row = mysql_fetch_array($result)) {
// only check stack if there is one
if (count($right) > 0) {
// 检查我们是否应该将节点移出堆栈
while ($right[count($right) - 1] < $row['rgt']) {
array_pop($right);
}
}
// 缩进显示节点的名称
echo str_repeat(' ',count($right)) . $row['name'] . "\n";
// 将这个节点加入到堆栈中
$right[] = $row['rgt'];
}
}
?>
[/php]

如果你运行一下以上的函数就会得到和递归函数一样的结果。只是我们的这个新的函数可能会更快一些,因为只有2次数据库查询。
要获知一个节点的路径就更简单了,如果我们想知道Cherry 的路径就利用它的左右值4和5来做一个查询。

  1. SELECT name FROM tree WHERE lft < 4 AND rgt >; 5 ORDER BY lft ASC;

复制代码

这样就会得到以下的结果:

以下是代码:

  1. +------------+
  2. | name |
  3. +------------+
  4. | Food |
  5. | Fruit |
  6. | Red |
  7. +------------+

复制代码

那么某个节点到底有多少子孙节点呢?很简单,子孙总数=(右值-左值-1)/2

  1. descendants = (right – left - 1) / 2

复制代码

不相信?自己算一算啦。
用这个简单的公式,我们可以很快的算出"Fruit 2-11"节点有4个子孙节点,而"Banana 8-9"节点没有子孙节点,也就是说它不是一个父节点了。
很神奇吧?虽然我已经多次用过这个方法,但是每次这样做的时候还是感到很神奇。
这的确是个很好的办法,但是有什么办法能够帮我们建立这样有左右值的数据表呢?这里再介绍一个函数给大家,这个函数可以将name和parent结构的表自动转换成带有左右值的数据表。
以下是代码:
[php]
< ?php
function rebuild_tree($parent, $left) {
// the right value of this node is the left value + 1
$right = $left+1;
// get all children of this node
$result = mysql_query("
SELECT name
FROM tree
WHERE parent = '" . $parent . "'
;"
);
while ($row = mysql_fetch_array($result)) {
// recursive execution of this function for each
// child of this node
// $right is the current right value, which is
// incremented by the rebuild_tree function
$right = rebuild_tree($row['name'], $right);
}
// we've got the left value, and now that we've processed
// the children of this node we also know the right value
mysql_query("
UPDATE tree
SET
lft = '" . $left . "',
rgt= '" . $right . "'
WHERE name = '" . $parent . "'
;"
);
// return the right value of this node + 1
return $right + 1;
}
?>[/php]
当然这个函数是一个递归函数,我们需要从根节点开始运行这个函数来重建一个带有左右值的树
[php]rebuild_tree('Food',1);[/php]
这个函数看上去有些复杂,但是它的作用和手工对表进行编号一样,就是将立体多层结构的转换成一个带有左右值的数据表。

那么对于这样的结构我们该如何增加,更新和删除一个节点呢?
增加一个节点一般有两种方法:
第一种,保留原有的name 和parent结构,用老方法向数据中添加数据,每增加一条数据以后使用rebuild_tree函数对整个结构重新进行一次编号。
第二种,效率更高的办法是改变所有位于新节点右侧的数值。举例来说:我们想增加一种新的水果"Strawberry"(草莓)它将成为"Red"节点的最后一个子节点。首先我们需要为它腾出一些空间。"Red"的右值应当从6改成8,"Yellow 7-10 "的左右值则应当改成 9-12。 依次类推我们可以得知,如果要给新的值腾出空间需要给所有左右值大于5的节点 (5 是"Red"最后一个子节点的右值) 加上2。 所以我们这样进行数据库操作:

  1. UPDATE tree SET rgt = rgt + 2 WHERE rgt > 5;
  2. UPDATE tree SET lft = lft + 2 WHERE lft > 5;

复制代码

这样就为新插入的值腾出了空间,现在可以在腾出的空间里建立一个新的数据节点了, 它的左右值分别是6和7

  1. INSERT INTO tree SET lft=6, rgt=7, name='Strawberry';

复制代码

再做一次查询看看吧!怎么样?很快吧。

四、结语
好了,现在你可以用两种不同的方法设计你的多级数据库结构了,采用何种方式完全取决于你个人的判断,但是对于层次多数量大的结构我更喜欢第二种方法。如果查询量较小但是需要频繁添加和更新的数据,则第一种方法更为简便。

另外,如果数据库支持的话 你还可以将rebuild_tree()和 腾出空间的操作写成数据库端的触发器函数, 在插入和更新的时候自动执行, 这样可以得到更好的运行效率, 而且你添加新节点的SQL语句会变得更加简单。

数据库结构:

采用左右值编码的保存该树的数据记录如下(设表名为tree):
c_id | name | left_node | right_node

1 |商品 | 1 | 18
2 |
食品 | 2 | 11
3 |
肉类 | 3 | 6
4 |
猪肉 | 4 | 5
5 |
菜类 | 7 | 10
6 |
白菜 | 8 | 9
7 |
电器 | 2 | 17
8 |
电视 | 13 | 14
9 |
电棒 | 15 | 16

第一次看见上面的数据记录,相信大部分人都不清楚左值(left_node)和右值(right_node)是根据什么规则计算出来的,而且,这种表设计似乎没有保存父节点的信息。下面把左右值和树结合起来,请看:
          1商品18
     +---------------------------------------+

2食品11 12电器17

+-----------------+ +---------------------+
3肉类6 7菜类10 13电视14
15
电棒16
4
猪肉5 8白菜9


请用手指指着上图中的数字,从1数到18,学习过数据结构的朋友肯定会发现什么吧?对,你手指移动的顺序就是对这棵树的进行先序遍历的顺序。接下来,让我讲述一下如何利用节点的左右值,得到该节点的父节点,子孙节点数量,及自己在树中的层数。

采用左右值编码的设计方案,在进行类别树的遍历时,由于只需进行2次查询,消除了递归,再加上查询条件都为数字比较,效率极高,类别树的记录条目越多,执行效率越高。



(上面的部分应该时我在网上COPY的吧~=.=~!!)

(下面的应用部分就是原创喽~~)


应用
某个节点到底有多少子孙节点?
子孙总数
=(父节点的右值 -父节点的左值-1/2

以节点食品举例,其子孙总数=(11-2-1/
2
4


如何判断某一节点下有没有子节点?
该节点左值-1等于其右值时,其下没有子节点。


检索某一父节点的所有子节点?
假定我们要对节点“食品”及其子孙节点进行先序遍历的列表,只需使用如下一条sql语句:

SELECT * FROM `tree` WHERE `left_node` BETWEEN 2 AND 11 ORDER BY `left_node` ASC


如何取得父类?
SELECT * FROM `tree` WHERE `left_node`<$left_node AND `right_node`>$right_node


检索之后如何列表?

当左值+1==右值时,该节点没有子节点,则下一节点不为其子节点

若下一节点的左值==上一节点右值+1,则2个节点是同级关系

若下一节点的左值==上一节点的左值+1时,则第2个节点应是第一个节点的子节点

若下一节点的左值-上一节点的右值>1时,则下一节点比上一节点高
(下一节点的左值-上一节点的右值)



在某一父节点下添加一个子节点?
1. 要求该子节点为该父节点下排序第一的节点,则$left_node =父节点left_node+1,
$right_node = $left_node+1;

2. 要求该节点位于父节点下一个子节点A后面,则$left_node
=
节点Aright_node+1, $right_node = $left_node+1;

3. 要求该节点是位于父节点下排序最后一位的节点,则$left_node =父节点right_node,
$right_node = $left_node+1;


Sql:
UPDATE `tree` SET `right_node`=`right_node`+2 WHERE `right_node`>=$left_node
UPDATE `tree` SET `left_node`=`left_node`+2 WHERE `left_node`>=$left_node
INSERT INTO `tree` (`name` , `left_node` , `right_node`) VALUES
(`
名字` , $left_node , $right_node)



移动节点,包括其子节点至节点A下?
设该节点左值$left_node ,右值$right_node
其子节点的数目为$count = ($right_node - $left_node -1 )/2 ,节点A左值为$A_left_node
,

UPDATE `tree` SET `right_node`=`right_node`-$right_node-$left_node-1 WHERE `right_node`>$right_node AND `right_node`<$A_left_node
UPDATE `tree` SET `left_node`=`left_node`-$right_node-$left_node-1 WHERE `left_node`>$right_node AND `left_node`<=$A_left_node
UPDATE `tree` SET `left_node`=`left_node`+$A_left_node-$right_node , `right_node`=`right_node`+$A_left_node-$right_node WHERE `left_node`>=$left_node
AND `right_node`<=$right_node




删除所有子节点?
DELETE FROM `tree` WHERE `left_node`>父节点的左值 AND `right_node`>父节点的右值


删除一个节点及其子节点?
在上例中的<>号后面各加一个=




下面是一个典型的多层数据结构示意图:

相关创建数据语句:
CREATE TABLE category(
category_id INT AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(20) NOT NULL,
parent INT DEFAULT NULL);

INSERT INTO category
VALUES(1,"ELECTRONICS",NULL),(2,"TELEVISIONS",1),(3,"TUBE",2),
(4,"LCD",2),(5,"PLASMA",2),(6,"PORTABLE ELECTRONICS",1),
(7,"MP3 PLAYERS",6),(8,"FLASH",7),
(9,"CD PLAYERS",6),(10,"2 WAY RADIOS",6);

SELECT * FROM category ORDER BY category_id;

在这种数据结构中,各层之间通过字段 parent 来形成邻接表,我们查询某些层级的关系的时候一般都是通过递归的方式,遍历某个层级关系的SQL的查询次数会顺着层级的增加,想想在层级有20的时候,根据某个底层节点取它到顶层节点的查询次数吧。

为了解决这个问题,人们想出了嵌套集模型(The Nested Set Model),请看下图:

上图依然是表现的与图一相同的层级关系,但是却更换了一种表现形式 下面是新的关系表和数据(关系和数据与之前相同,但是表结构不一样):

CREATE TABLE nested_category (
category_id INT AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(20) NOT NULL,
lft INT NOT NULL,
rgt INT NOT NULL
);

INSERT INTO nested_category
VALUES(1,"ELECTRONICS",1,20),(2,"TELEVISIONS",2,9),(3,"TUBE",3,4),
(4,"LCD",5,6),(5,"PLASMA",7,8),(6,"PORTABLE ELECTRONICS",10,19),
(7,"MP3 PLAYERS",11,14),(8,"FLASH",12,13),
(9,"CD PLAYERS",15,16),(10,"2 WAY RADIOS",17,18);

SELECT * FROM nested_category ORDER BY category_id;

这里将 left,right 修改为 lft,rgt因为这两个词在MYSQL中属于关键字 下面我们将插入的数据标识在图上:

同样,我们将数据标识在原来的结构上:

怎么样,是不是很明确了

下面使我自己标定一种形式,方便理解

[1
[2
[3 4]
[5 6]
[7 8]
9]
[10
[11
[12 13]
14]
[15 16]
[17 18]
19]
20]

===========================================================
以上是MySQL 所推荐的左右值法(毗邻目录法、预排序历遍法)

我的想法是根据category的内容,用一个存储过程来计算,把结果算出来放到nested_category中。    

抱歉!评论已关闭.