首页 | PHP资讯 | 技术专栏 | 资源共享 | PHP培训 | PHP职场 | 图书 | PHP ON WIN | PHP圈子
返回列表 回复 发帖

[总结] 父子ID法无限分类的简单实现算法

[总结] 父子ID法无限分类的简单实现算法

1、引言
无限分类在很多应用中是会经常用到的,比如CMS的文章分类表,工厂生产的BOM物料,在线商店Products产品分类表,等等。
很多初学者对无限分类的算法还是不能深刻的理解,七月十五在这里献丑,为大家初略的讲述一下无限分类表的基本算法。
关键词: 无限分类, 族谱, 递归, SQL

2、数据结构(族谱)
我们以一个家族的族谱来构建一个无限分类。其数据结构如下。
  1. +---------------------------+
  2. | ID | PARENT |    NAME     |
  3. +----+--------+-------------+
  4. | 1  | 0      |    祖父     |
  5. +----+--------+-------------+
  6. | 2  | 1      |    父亲     |
  7. +----+--------+-------------+
  8. | 3  | 1      |    叔伯     |
  9. +----+--------+-------------+
  10. | 4  | 2      |    自己     |
  11. +----+--------+-------------+
  12. | 5  | 4      |    儿子     |
  13. +----+--------+-------------+
  14. | 6  | 5      |    孙子     |
  15. +----+--------+-------------+
  16. | 7  | 2      |    姐妹     |
  17. +----+--------+-------------+
  18. | 8  | 3      |    表亲     |
  19. +----+--------+-------------+
  20. | 9  | 7      |    甥儿     |
  21. +----+--------+-------------+
  22. | 10 | 4      |    女儿     |
  23. +----+--------+-------------+
  24. | 11 | 10     |    外孙     |
  25. +----+--------+-------------+
  26. | 12 | 5      |    孙女     |
  27. +----+--------+-------------+
  28. | .. | ...    |    ....     |
  29. +---------------------------+
复制代码
可以看到我们只需要设计一个ID跟一个PARENT(来自其内部ID),就可以构建出整个族谱之间的联系。
比如:
1)、已知任一ID,可以求得祖先族系树
如已知 ID=11(外孙), 很容易就跟据ID跟PARENT的关系查得祖先树(含自身)如下:
  1. array(
  2.     array(11, 10, 外孙),
  3.     array(10, 4, 女儿),
  4.     array(4, 2, 自己),
  5.     array(2, 1, 父亲)
  6.     array(1, 0, 祖父)
  7. )
复制代码
2)、已知任一ID,可以求其后代(含自己)列表
比如已知ID=4(自己),跟据ID和PARENT关系可以查得后代如下:
  1. array(
  2.     array(4, 2, 自己),
  3.     array(5, 4, 儿子),
  4.     array(6, 5, 孙子),
  5.     array(12, 5, 孙女),
  6.     array(10, 4, 女儿),
  7.     array(11, 10, 外孙)
  8. )
复制代码
3、SQL
根据以上的数据结构我们创建一个MySQL<span href="tag.php?name=%CA%FD%BE%DD%BF%E2" class="t_tag">数据库</span>
  1. CREATE DATABASE family DEFAULT CHARSET 'utf8';
  2. USE family;
  3. CREATE TABLE family (
  4.     id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
  5.     parent INT(10) UNSIGNED NOT NULL DEFAULT '0',
  6.     name CHAR(30) NOT NULL DEFAULT '',
  7.     UNIQUE KEY (parent, name)
  8. );
  9. INSERT INTO family (id, parent, name )
  10. VALUES
  11.     ( 1, 0, '祖父'),
  12.     ( 2, 1, '父亲'),
  13.     ( 3, 1, '叔伯'),
  14.     ( 4, 2, '自己'),
  15.     ( 5, 4, '儿子'),
  16.     ( 6, 5, '孙子'),
  17.     ( 7, 2, '姐妹'),
  18.     ( 8, 3, '表亲'),
  19.     ( 9, 7, '甥儿'),
  20.     ( 10, 4, '女儿'),
  21.     ( 11, 10, '外孙'),
  22.     ( 12, 5, '孙女');
复制代码
4、算法
其余的与无限分类无关的算法,我这里就不演示了。与无限分类有关的算法有两个。
其一、祖先树。(我们以一维数组来取得所有列的详细数据)
其二、后代表。(因为涉及到实际应用的关联操作,我们这里给出求出一组指定id的所有后代id集合的一维数组的方法)
1)、祖先树
以指定的id求得其父母辈的id,如果存在,则再以求得id求父母辈的id,直到求不到其父母辈的id为止,返回一个二维数组。
2)、后代ID表
以指定的id求得其子女的id,如果存在,则再以求得的id来求子女id,直到求不到其子女id为止,返回一个含有所有求得id的一维数组。

5、代码
[php]
<?php
/**
* 族谱
*
* 以一个实例演示简单无限分类的算法
*
* @copyrihgt HentStudio, 2008
* @author 七月十五 <zergdo@gmail.com>
* @version $Id: family.php, v 0.0.1 2008/09/23 16:07:25 uw Exp $
*/

/**
* 获取祖先树二维数组,长幼逆序,不含己身
* @param int $id 己身所在id
* @return array
*/
function _getForefathers($id) {
    $data = array();
    $sql = "
        SELECT *
        FROM family
        WHERE id = (
            SELECT parent
            FROM family
            WHERE id = '" . $id ."')
        ;";
    $re = <span href="tag.php?name=mysql" class="t_tag">mysql</span>_query($sql);
    if(mysql_num_rows($re)) {   /* 如果存在有祖先 */
        $data[] = $rs = mysql_fetch_assoc($re);
        $data = array_merge($data, _getForefathers($rs['id'])); /* 递归查询 */
        return $data;
    } else {
        return $data;
    }
}

/**
* 获取祖先树二维数组,长幼顺序,含己身
* @param int $id 己身所在id
* @return array
*/
function getForefathers($id) {
    return array_reverse(array_merge(array(mysql_fetch_assoc(mysql_query("SELECT * FROM family WHERE id = '" . $id . "'; "))), _getForefathers($id)));
}

/**
* 获取指定id的所有后代,不含指定id
* @param mixed $id 指定id, 有可能是array
* @return array 所有后代id的一维数组
*/
function _getOffspring($id) {
    $data = array();
    $ids = array();
    if(!is_array($id)) { $id = array($id); }
    $id = implode(', ', $id);
    $sql = "
        SELECT *
               FROM family
               WHERE parent IN (" . $id . ") ;";
    $re = mysql_query($sql);
    if(mysql_num_rows($re)) {
        while($rs = mysql_fetch_assoc($re)) {
                   $ids[] = $rs['id'];
               }
               $ids = array_merge($ids, _getOffspring($ids));
               return $ids;
    } else {
        return $ids;
    }
}

/**
* 获得指定id的所有后代,含指定id
* @param mixed $id 指定id, 有可能是array
* @return array 所有后代的和指定id的一维数组
*/
function getOffspring($id) {
    if(!is_array($id)) { $id = array($id); }
    return array_merge($id, _getOffspring($id));
}


/* 主程序 */
ini_set('default_charset', 'utf-8');    /* 设定HTML输出编码为utf-8 */
mysql_connect('localhost', 'root', ''); /* 连接MySQL */
mysql_select_db('family');              /* 打开family数据库 */
mysql_query("SET NAMES 'utf8'");        /* 设定数据库输出编码 */

echo '<pre>';
var_dump(getForefathers(11));           /* 输出ID=11的祖先树 */
var_dump(getOffspring(array(3, 4)));     /* 输出ID=3及ID=4的后代ID表 */
echo '</pre>';
[/php]

6、附件


7、结语
当然以上只实现了无限分类的基本算法,对于无限分类的数据结构的分析还有很多的版本,不同的版本实现也是不一样的。
我这里只给出var_dump的内容,具体到应用里如何使用,相信大家都能掌握。实用代码我就不画蛇添足了。帖图两张以飨读者。
如果无限分类能在SQL层面求得结果的话那是最好的,比如以一句或若干句SQL求得,或以SQL的存储过程求得。七月十五才疏学浅,目前只能从外部程序(PHP)层面实现了无限分类的上述功能。如果大家有更好的解决方法,欢迎指教,谢谢。


  • 祖先导航树
  • 删除指定的IDs及其所有后代

[以上两图来自LeoPHP的example的RBAC]

8、补充
一直想利用一句SQL来求解,以SQL递归可以实现。
现公布第二个问题的SQL递归不完善的求解方法(不含己身)
但这个SQL还不能实现任意深度的查询。
  1. SELECT p2 . *
  2. FROM family AS p1, family AS p2
  3. WHERE p1.id = p2.parent
  4. AND (
  5. p1.id = 4
  6. OR p1.parent = 4
  7. )
复制代码
第一个问题的SQL就留给大家思考写出来吧。

[本文为七月十五原创,转载请注明出自PHPChina]
附件: 您需要登录才可以下载或查看附件。没有帐号?注册
2007算才入门,2008领会OOP,2009明白Service,2010会是什么呢? —— 十五工作室

知道原理 但是怎么显示树形菜单  原理是什么?
PPC菊部地区有雨加血.

TOP

循环查询我是强烈反对的

TOP

原帖由 gun 于 2008-9-23 17:39 发表
循环查询我是强烈反对的

少量数据时未为不可,看应用需要
PHP对递归的支持的确是有些诟病,据说用了栈,数据量大时有溢出的危险
2007算才入门,2008领会OOP,2009明白Service,2010会是什么呢? —— 十五工作室

TOP

数据量大的时候用左右值最好

TOP

原帖由 happyeddie 于 2008-9-24 20:58 发表
数据量大的时候用左右值最好

左右值也是无限分类的一种算法。
但是恰好相反,在分类数据量大的时候不推荐。
算法也比较麻烦,添加和编辑一个分类时会涉及到很多分类的改动。
适合数据量小且不经常改动的无限分类。

Type_id

Name

Lft

Rgt

1

商品

1

18

2

食品

2

11

3

肉类

3

6

4

猪肉

4

5

5

蔬菜类

7

10

6

白菜

8

9

7

电器

12

17

8

电视机

13

14

9

电冰箱

15

16


  看一下上面的表就知道了,左值大于1右值小于18的为商品,左值小于2右值大于11的为食品。如果商品分类还要多的话,左右值就要动态更新。
  优点:在消除递归的前提下实现了无限分级,而且查询条件是基于整形数字比较的,效率很高。可以进行先序列表,添加,修改,删除,同层平移等常规操作,基本满足需求。
  缺点:由于这种左右值编码的方式和常见的阿拉伯数字直观排序不同,再加上节点在树中的层次,顺序不是直观显示出来,而必须通过简单的公式计算后得到,需要花费一定的时间对其数学模型进行深入理解。而且,采用该方案编写相关存储过程,新增,删除,同层平移节点需要对整个树进行查询修改,由此导致的代码复杂度,耦合度较高,修改维护的风险较高。


其实分类一般数据量不会很大,算法和思路简明者取胜,个人比较倾向于“ID,父ID 递归”来解决无限分类问题。

左右值无限分类算不请参阅: http://bbs.phpchina.com/viewthread.php?tid=46175

[ 本帖最后由 七月十五 于 2008-9-24 22:05 编辑 ]
2007算才入门,2008领会OOP,2009明白Service,2010会是什么呢? —— 十五工作室

TOP

呵呵,空间换时间,如果数据量不大,直接将全部数据都读到一个数组里面,然后再处理会更好。你还可以在表里面加一些冗余字段以提高速度和减少读取的数据量。

TOP

PHP的递归一直为很多人诟病

  1. 对递归的不良支持

  递归是一种函数调用自身的机制。这是一种强大的特性可以把某些复杂的东西变得很简单。有一个使用递归的例子是快速排序(quicksort)。不幸的是,PHP并不擅长递归。Zeev,一个PHP开发人员,说道:“PHP 4.0(Zend)对密集数据使用了栈方式,而不是使用堆方式。也就是说它能容忍的递归函数的数量限制和其他语言比起来明显少。”见bug 1901。这是一个很不好的借口。每一个编程语言都应该提供良好的递归支持。


那么递归的数量限制到底是多少?
多大的数量递归会导致溢出或效率低下?
没人给出具体数据,我也没见到有关的测试文献。
我想无限分类这么一点数据量还不足以把PHP递归给撑死了。
其实PHP递归完全可以加以控制很好的运用。
如果因一点点的不足而不用递归,岂非因噎废食

[ 本帖最后由 七月十五 于 2008-9-24 22:33 编辑 ]
2007算才入门,2008领会OOP,2009明白Service,2010会是什么呢? —— 十五工作室

TOP

呵呵,你的无限分类绝对不会将PHP递归撑死。因为数据库会在递归死掉之前崩溃。

TOP

原帖由 sentrychen 于 2008-9-24 23:20 发表
呵呵,你的无限分类绝对不会将PHP递归撑死。因为数据库会在递归死掉之前崩溃。

愿闻其详,敬请指教。
2007算才入门,2008领会OOP,2009明白Service,2010会是什么呢? —— 十五工作室

TOP

返回列表