算法设计最长公共子序列.docVIP

  • 7
  • 0
  • 约4.61千字
  • 约 9页
  • 2017-09-02 发布于浙江
  • 举报
算法设计最长公共子序列

最长公共子序列(LCS)算法 算法要求及分析 1. 算法要求:利用b[i,j],设计一个算法求出全部的LCS;利用”会计方法”,分析所编算法的时间复杂度的最坏情况。 2. 算法分析:该部分思路同课件 算法详细设计 为了求出全部的LCS,需要设计两个功能函数:LCS_L和LCS_Output,函数LCS_L实现计算LCS长度及每个子问题的由来;函数LCS_Output用递归方法实现输出所有LCS。 具体设计实现思路: 声明全局变量 二维动态数组C和b。数组C记录所要求的LCS的长度;数组b记录C[i,j]是通过哪一个子问题的值求得的。定义枚举类型记录不同的遍历方向。 用动态规划法实现功能函数LCS_L,得出数组C和b。 函数实现思路:首先动态分配和初始化二维数组C和b,然后计算出C和b。 根据X[i]和Y[j]的关系,计算得出C[i,j]: (若X[i]=Y[j],则执行C[i,j]←C[i-1,j-1]+1且b[i][j]=ual; (若X[i]!=Y[j],则分为三种情况: 若C[i-1,j]C[i,j-1]则C[i,j]取C[i-1,j]且b[i][j]=up; 若C[i-1,j]C[i,j-1]则C[i,j]取C[i,j-1]且b[i][j]=le; 若C[i-1,j]=C[i,j-1]则C[i,j]取C[i-1,j]且b[i][j]=uol; 根据C和b编写输出函数LCS_Output输出所有的LCS。函数实现思路: 设置变量cur_len记录当前的数组下标,变量len保存当前LCS数组的元素个数。依次扫描二维数组b,从最后一个开始,根据b的值来判断递归方向: 当b的值是ual时,LCS数组保存当前字符,len++,沿对角线递归(递归完成要回溯);len等于LCS的长度时即找到一个LCS序列并输出; 当b的值是up时,向上递归; 当b的值是le时,向左递归; 当b的值是uol时,要找出所有的LCS,故既要向左也要向上递归。 主函数给出不同的测试数据输出相应的最长公共子序列长度和所有的最长公共子序列。 算法流程图 功能函数LCS_L详细流程图 开始 N Y N Y Y N 大于 等于 小于 功能函数LCS_Output详细流程图 N Y Y N Y N Y N Y N 测试结果 通过四组数据(见程序)测试均得到正确结果,截图如下: 分析和总结 结果分析: 第一组数据为课件上的例题,结果正确; 第二组数据为无最长公共子序列例题,结果正确; 第三组数据为较长较多的公共子序列例题,结果正确; 第四组数据为一个但多次有重复的最长公共子序列例题,结果正确。 时间复杂度分析: 显然用于求解出数组C和b的功能函数LCS_L时间复杂度O(m×n);由功能函数LCS_Output可知,求出所有的LCS实际上根据搜索不同的方向递归遍历出所有符合要求的序列,故时间复杂度取决于遍历的路径数。遍历的路径数目分为: 最好情况下,即m=n并且一直沿着对角线方向搜索,时间复杂度为O(n); 最坏的情况下,即两个序列不存在最长公共子序列,此时数组C所有值为0,数组b所有的值都为uol(向上或者向左搜索)。最坏情况下的时间复杂度即是求出从点S(m,n)到i=0或者j=0(i=0且j=0除外)的所有的路径。 Q(0,n) S(m,n) Q(0,1) P(1,0) P(m,0) 建立坐标系如上图(此图中由点S向左或者向下遍历),坐标系中的点,轴上的坐标点,轴上的系列坐标点,其中.由于是搜索路径的边界上的点,点不能直接到达点,点也不能直接到达,所以点到和的路径数等价于到点和点的路径数,又因为点到路径数为,设总路径数为,则有 故: 故最坏的情况下,求出所有的LCS的时间复杂度是。 源代码 #include iostream using namespace std; int len = 0; //回溯时记录当前LCS数组的长度 char *lcs; //用于保存一个最长公共子序列 int **C; //记录Xi与Yj的LCS的长度 int **b; //记录C[i,j]是通过哪一个子问题的值求得的 enum {ual,up,le,uol};//枚举记录方向分别为:左和上、上、左、左或上 void LCS_L(char *X,char *Y,int m,int n)//求出各个b[i][j]和C[i][j]的值 { C = new int *[m]; b = new int *[m]; for(int k=0;km;k++) { C[k] = ne

文档评论(0)

1亿VIP精品文档

相关文档