Update to 2.0.0 tree from current Fremantle build
[opencv] / 3rdparty / lapack / dlauum.c
1 #include "clapack.h"
2
3 /* Table of constant values */
4
5 static integer c__1 = 1;
6 static integer c_n1 = -1;
7 static doublereal c_b15 = 1.;
8
9 /* Subroutine */ int dlauum_(char *uplo, integer *n, doublereal *a, integer *
10         lda, integer *info)
11 {
12     /* System generated locals */
13     integer a_dim1, a_offset, i__1, i__2, i__3, i__4;
14
15     /* Local variables */
16     integer i__, ib, nb;
17     extern /* Subroutine */ int dgemm_(char *, char *, integer *, integer *, 
18             integer *, doublereal *, doublereal *, integer *, doublereal *, 
19             integer *, doublereal *, doublereal *, integer *);
20     extern logical lsame_(char *, char *);
21     extern /* Subroutine */ int dtrmm_(char *, char *, char *, char *, 
22             integer *, integer *, doublereal *, doublereal *, integer *, 
23             doublereal *, integer *);
24     logical upper;
25     extern /* Subroutine */ int dsyrk_(char *, char *, integer *, integer *, 
26             doublereal *, doublereal *, integer *, doublereal *, doublereal *, 
27              integer *), dlauu2_(char *, integer *, 
28             doublereal *, integer *, integer *), xerbla_(char *, 
29             integer *);
30     extern integer ilaenv_(integer *, char *, char *, integer *, integer *, 
31             integer *, integer *);
32
33
34 /*  -- LAPACK auxiliary routine (version 3.1) -- */
35 /*     Univ. of Tennessee, Univ. of California Berkeley and NAG Ltd.. */
36 /*     November 2006 */
37
38 /*     .. Scalar Arguments .. */
39 /*     .. */
40 /*     .. Array Arguments .. */
41 /*     .. */
42
43 /*  Purpose */
44 /*  ======= */
45
46 /*  DLAUUM computes the product U * U' or L' * L, where the triangular */
47 /*  factor U or L is stored in the upper or lower triangular part of */
48 /*  the array A. */
49
50 /*  If UPLO = 'U' or 'u' then the upper triangle of the result is stored, */
51 /*  overwriting the factor U in A. */
52 /*  If UPLO = 'L' or 'l' then the lower triangle of the result is stored, */
53 /*  overwriting the factor L in A. */
54
55 /*  This is the blocked form of the algorithm, calling Level 3 BLAS. */
56
57 /*  Arguments */
58 /*  ========= */
59
60 /*  UPLO    (input) CHARACTER*1 */
61 /*          Specifies whether the triangular factor stored in the array A */
62 /*          is upper or lower triangular: */
63 /*          = 'U':  Upper triangular */
64 /*          = 'L':  Lower triangular */
65
66 /*  N       (input) INTEGER */
67 /*          The order of the triangular factor U or L.  N >= 0. */
68
69 /*  A       (input/output) DOUBLE PRECISION array, dimension (LDA,N) */
70 /*          On entry, the triangular factor U or L. */
71 /*          On exit, if UPLO = 'U', the upper triangle of A is */
72 /*          overwritten with the upper triangle of the product U * U'; */
73 /*          if UPLO = 'L', the lower triangle of A is overwritten with */
74 /*          the lower triangle of the product L' * L. */
75
76 /*  LDA     (input) INTEGER */
77 /*          The leading dimension of the array A.  LDA >= max(1,N). */
78
79 /*  INFO    (output) INTEGER */
80 /*          = 0: successful exit */
81 /*          < 0: if INFO = -k, the k-th argument had an illegal value */
82
83 /*  ===================================================================== */
84
85 /*     .. Parameters .. */
86 /*     .. */
87 /*     .. Local Scalars .. */
88 /*     .. */
89 /*     .. External Functions .. */
90 /*     .. */
91 /*     .. External Subroutines .. */
92 /*     .. */
93 /*     .. Intrinsic Functions .. */
94 /*     .. */
95 /*     .. Executable Statements .. */
96
97 /*     Test the input parameters. */
98
99     /* Parameter adjustments */
100     a_dim1 = *lda;
101     a_offset = 1 + a_dim1;
102     a -= a_offset;
103
104     /* Function Body */
105     *info = 0;
106     upper = lsame_(uplo, "U");
107     if (! upper && ! lsame_(uplo, "L")) {
108         *info = -1;
109     } else if (*n < 0) {
110         *info = -2;
111     } else if (*lda < max(1,*n)) {
112         *info = -4;
113     }
114     if (*info != 0) {
115         i__1 = -(*info);
116         xerbla_("DLAUUM", &i__1);
117         return 0;
118     }
119
120 /*     Quick return if possible */
121
122     if (*n == 0) {
123         return 0;
124     }
125
126 /*     Determine the block size for this environment. */
127
128     nb = ilaenv_(&c__1, "DLAUUM", uplo, n, &c_n1, &c_n1, &c_n1);
129
130     if (nb <= 1 || nb >= *n) {
131
132 /*        Use unblocked code */
133
134         dlauu2_(uplo, n, &a[a_offset], lda, info);
135     } else {
136
137 /*        Use blocked code */
138
139         if (upper) {
140
141 /*           Compute the product U * U'. */
142
143             i__1 = *n;
144             i__2 = nb;
145             for (i__ = 1; i__2 < 0 ? i__ >= i__1 : i__ <= i__1; i__ += i__2) {
146 /* Computing MIN */
147                 i__3 = nb, i__4 = *n - i__ + 1;
148                 ib = min(i__3,i__4);
149                 i__3 = i__ - 1;
150                 dtrmm_("Right", "Upper", "Transpose", "Non-unit", &i__3, &ib, 
151                         &c_b15, &a[i__ + i__ * a_dim1], lda, &a[i__ * a_dim1 
152                         + 1], lda)
153                         ;
154                 dlauu2_("Upper", &ib, &a[i__ + i__ * a_dim1], lda, info);
155                 if (i__ + ib <= *n) {
156                     i__3 = i__ - 1;
157                     i__4 = *n - i__ - ib + 1;
158                     dgemm_("No transpose", "Transpose", &i__3, &ib, &i__4, &
159                             c_b15, &a[(i__ + ib) * a_dim1 + 1], lda, &a[i__ + 
160                             (i__ + ib) * a_dim1], lda, &c_b15, &a[i__ * 
161                             a_dim1 + 1], lda);
162                     i__3 = *n - i__ - ib + 1;
163                     dsyrk_("Upper", "No transpose", &ib, &i__3, &c_b15, &a[
164                             i__ + (i__ + ib) * a_dim1], lda, &c_b15, &a[i__ + 
165                             i__ * a_dim1], lda);
166                 }
167 /* L10: */
168             }
169         } else {
170
171 /*           Compute the product L' * L. */
172
173             i__2 = *n;
174             i__1 = nb;
175             for (i__ = 1; i__1 < 0 ? i__ >= i__2 : i__ <= i__2; i__ += i__1) {
176 /* Computing MIN */
177                 i__3 = nb, i__4 = *n - i__ + 1;
178                 ib = min(i__3,i__4);
179                 i__3 = i__ - 1;
180                 dtrmm_("Left", "Lower", "Transpose", "Non-unit", &ib, &i__3, &
181                         c_b15, &a[i__ + i__ * a_dim1], lda, &a[i__ + a_dim1], 
182                         lda);
183                 dlauu2_("Lower", &ib, &a[i__ + i__ * a_dim1], lda, info);
184                 if (i__ + ib <= *n) {
185                     i__3 = i__ - 1;
186                     i__4 = *n - i__ - ib + 1;
187                     dgemm_("Transpose", "No transpose", &ib, &i__3, &i__4, &
188                             c_b15, &a[i__ + ib + i__ * a_dim1], lda, &a[i__ + 
189                             ib + a_dim1], lda, &c_b15, &a[i__ + a_dim1], lda);
190                     i__3 = *n - i__ - ib + 1;
191                     dsyrk_("Lower", "Transpose", &ib, &i__3, &c_b15, &a[i__ + 
192                             ib + i__ * a_dim1], lda, &c_b15, &a[i__ + i__ * 
193                             a_dim1], lda);
194                 }
195 /* L20: */
196             }
197         }
198     }
199
200     return 0;
201
202 /*     End of DLAUUM */
203
204 } /* dlauum_ */