转载

算法分析与设计——矩阵连乘问题

问题描述：

给定n个矩阵：A1,A2,...,An，其中Ai与Ai+1是可乘的，i=1，2...，n-1。确定计算矩阵连乘积的计算次序，使得依此次序计算矩阵连乘积需要的数乘次数最少。输入数据为矩阵个数和每个矩阵规模，输出结果为计算矩阵连乘积的计算次序和最少数乘次数。

问题解析：

由于矩阵乘法满足结合律，故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定，也就是说该连乘积已完全加括号，则可以依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。

完全加括号的矩阵连乘积可递归地定义为：

（1）单个矩阵是完全加括号的；

（2）矩阵连乘积A是完全加括号的，则A可表示为2个完全加括号的矩阵连乘积B和C的乘积并加括号，即A=(BC)

例如，矩阵连乘积A1A2A3A4有5种不同的完全加括号的方式：(A1(A2(A3A4)))，(A1((A2A3)A4))，((A1A2)(A3A4))，((A1(A2A3))A4)，(((A1A2)A3)A4)。每一种完全加括号的方式对应于一个矩阵连乘积的计算次序，这决定着作乘积所需要的计算量。

看下面一个例子，计算三个矩阵连乘{A1，A2，A3}；维数分别为10*100 , 100*5 , 5*50 按此顺序计算需要的次((A1*A2*A3):10X100X5+10X5X50=7500次，按此顺序计算需要的次数(A1*(A2*A3)):10*5*50+10*100*50=75000次

所以问题是：如何确定运算顺序，可以使计算量达到最小化。

算法思路：

例：设要计算矩阵连乘乘积A1A2A3A4A5A6，其中各矩阵的维数分别是：

A1：30*35; A2：35*15; A3：15*5; A4：5*10; A5：10*20; A6：20*25

递推关系：

设计算A[i:j]，1≤i≤j≤n，所需要的最少数乘次数m[i,j]，则原问题的最优值为m[1,n]。

当i=j时，A[i:j]=Ai，因此，m[i][i]=0，i=1,2,…,n

当i<j时，若A[i:j]的最优次序在Ak和Ak+1之间断开，i<=k<j,则：m[i][j]=m[i][k]+m[k+1][j]+pi-1*pk*pj。由于在计算是并不知道断开点k的位置，所以k还未定。不过k的位置只有j-i个可能。因此，k是这j-i个位置使计算量达到最小的那个位置。

综上，有递推关系如下：

算法分析与设计——矩阵连乘问题

计算最优值：

用动态规划算法解此问题时，可依据其递归式以自底向上的方式进行计算。在计算过程中，保存以解决的子问题的答案，每个子问题只计算一次，而在后面用到时只需要简单查一下，避免了大量的重复计算，最后得到了多项式时间的算法。

代码如下：

 1 void matrixChain(int p[],int m[][],int s[][])  2 //p用来记录矩阵，m[i][j]表示第i个矩阵到第j个矩阵的最优解，s[][]记录从哪里断开可以得到最优解  3 {  4     int n=len-1;  5     for(int i=1; i<=n; i++)//初始化数组  6         m[i][j]=0;  7     for(int r=2; r<=n; r++)//对角线循环  8     {  9         for(int i=1; i<=n-r+1; i++) //行循环 10         { 11             int j=i+r-1;//列的控制 12             m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值，初始化使k=i; 13             s[i][j]=i; 14             for(int k=i+1; k<j; k++) 15             { 16                 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; 17                 if(t<m[i][j]) 18                 { 19                     s[i][j]=k;//在k位置断开得到最优解 20                     m[i][j]=t; 21                 } 22             } 23         } 24     } 25 }

构造最优解 ：

若将对应m[i][j]的断开位置k记为s[i][j]，在计算出最优值m[i][j]后，可递归地由s[i][j]构造出相应的最优解。s[i][j]中的数表明，计算矩阵链A[i:j]的最佳方式应在矩阵Ak和Ak+1之间断开，即最优的加括号方式应为(A[i:k])(A[k+1:j)。因此，从s[1][n]记录的信息可知计算A[1:n]的最优加括号方式为(A[1:s[1][n]])(A[s[1][n]+1:n])，进一步递推，A[1:s[1][n]]的最优加括号方式为(A[1:s[1][s[1][n]]])(A[s[1][s[1][n]]+1:s[1][s[1][n]]])。同理可以确定A[s[1][n]+1:n]的最优加括号方式在s[s[1][n]+1][n]处断开...照此递推下去，最终可以确定A[1:n]的最优完全加括号方式，及构造出问题的一个最优解。

代码如下：

1 void traceback(int s[][],int i,int j) 2 { 3     if(i==j) 4         retiurn; 5     traceback(s,i,s[i][j]); 6     traceback(s,s[i][j]+1,j); 7     cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl; 8 }

完整代码如下：

 1 #include<stdio.h>  2 #include<iostream>  3 #include<algorithm>  4 #include<stdlib.h>  5 using namespace std;  6 const int MAX = 100;  7 int n;  8 int p[MAX+1],m[MAX][MAX],s[MAX][MAX];  9 //p用来记录矩阵，m[i][j]表示第i个矩阵到第j个矩阵的最优解，s[][]记录从哪里断开可以得到最优解 10 void matrixChain() 11 { 12     for(int i=1; i<=n; i++)//初始化数组 13         m[i][i]=0; 14     for(int r=2; r<=n; r++)//对角线循环 15     { 16         for(int i=1; i<=n-r+1; i++) //行循环 17         { 18             int j=i+r-1;//列的控制 19             m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值，初始化使k=i; 20             s[i][j]=i; 21             for(int k=i+1; k<j; k++) 22             { 23                 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; 24                 if(t<m[i][j]) 25                 { 26                     s[i][j]=k;//在k位置断开得到最优解 27                     m[i][j]=t; 28                 } 29             } 30         } 31     } 32 } 33 void traceback(int i,int j) 34 { 35     if(i==j) 36         return; 37     traceback(i,s[i][j]); 38     traceback(s[i][j]+1,j); 39     cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl; 40 } 41 int main() 42 { 43     cin>>n; 44     for(int i=0; i<=n; i++) 45         cin>>p[i]; 46     matrixChain(); 47     traceback(1,n); 48     cout<<m[1][n]<<endl; 49     return 0; 50 }