dgesvd_8f_source.html

*> \brief <b> DGESVD computes the singular value decomposition (SVD) for GE matrices</b>

*

*  =========== DOCUMENTATION ===========

*

* Online html documentation available at

*            http://www.netlib.org/lapack/explore-html/

*

*> \htmlonly

*> Download DGESVD + dependencies

*> <a href="http://www.netlib.org/cgi-bin/netlibfiles.tgz?format=tgz&filename=/lapack/lapack_routine/dgesvd.f">

*> [TGZ]</a>

*> <a href="http://www.netlib.org/cgi-bin/netlibfiles.zip?format=zip&filename=/lapack/lapack_routine/dgesvd.f">

*> [ZIP]</a>

*> <a href="http://www.netlib.org/cgi-bin/netlibfiles.txt?format=txt&filename=/lapack/lapack_routine/dgesvd.f">

*> [TXT]</a>

*> \endhtmlonly

*

*  Definition:

*  ===========

*

*       SUBROUTINE DGESVD( JOBU, JOBVT, M, N, A, LDA, S, U, LDU, VT, LDVT,

*                          WORK, LWORK, INFO )

*

*       .. Scalar Arguments ..

*       CHARACTER          JOBU, JOBVT

*       INTEGER            INFO, LDA, LDU, LDVT, LWORK, M, N

*       ..

*       .. Array Arguments ..

*       DOUBLE PRECISION   A( LDA, * ), S( * ), U( LDU, * ),

*      $                   VT( LDVT, * ), WORK( * )

*       ..

*

*

*> \par Purpose:

*  =============

*>

*> \verbatim

*>

*> DGESVD computes the singular value decomposition (SVD) of a real

*> M-by-N matrix A, optionally computing the left and/or right singular

*> vectors. The SVD is written

*>

*>      A = U * SIGMA * transpose(V)

*>

*> where SIGMA is an M-by-N matrix which is zero except for its

*> min(m,n) diagonal elements, U is an M-by-M orthogonal matrix, and

*> V is an N-by-N orthogonal matrix.  The diagonal elements of SIGMA

*> are the singular values of A; they are real and non-negative, and

*> are returned in descending order.  The first min(m,n) columns of

*> U and V are the left and right singular vectors of A.

*>

*> Note that the routine returns V**T, not V.

*> \endverbatim

*

*  Arguments:

*  ==========

*

*> \param[in] JOBU

*> \verbatim

*>          JOBU is CHARACTER*1

*>          Specifies options for computing all or part of the matrix U:

*>          = 'A':  all M columns of U are returned in array U:

*>          = 'S':  the first min(m,n) columns of U (the left singular

*>                  vectors) are returned in the array U;

*>          = 'O':  the first min(m,n) columns of U (the left singular

*>                  vectors) are overwritten on the array A;

*>          = 'N':  no columns of U (no left singular vectors) are

*>                  computed.

*> \endverbatim

*>

*> \param[in] JOBVT

*> \verbatim

*>          JOBVT is CHARACTER*1

*>          Specifies options for computing all or part of the matrix

*>          V**T:

*>          = 'A':  all N rows of V**T are returned in the array VT;

*>          = 'S':  the first min(m,n) rows of V**T (the right singular

*>                  vectors) are returned in the array VT;

*>          = 'O':  the first min(m,n) rows of V**T (the right singular

*>                  vectors) are overwritten on the array A;

*>          = 'N':  no rows of V**T (no right singular vectors) are

*>                  computed.

*>

*>          JOBVT and JOBU cannot both be 'O'.

*> \endverbatim

*>

*> \param[in] M

*> \verbatim

*>          M is INTEGER

*>          The number of rows of the input matrix A.  M >= 0.

*> \endverbatim

*>

*> \param[in] N

*> \verbatim

*>          N is INTEGER

*>          The number of columns of the input matrix A.  N >= 0.

*> \endverbatim

*>

*> \param[in,out] A

*> \verbatim

*>          A is DOUBLE PRECISION array, dimension (LDA,N)

*>          On entry, the M-by-N matrix A.

*>          On exit,

*>          if JOBU = 'O',  A is overwritten with the first min(m,n)

*>                          columns of U (the left singular vectors,

*>                          stored columnwise);

*>          if JOBVT = 'O', A is overwritten with the first min(m,n)

*>                          rows of V**T (the right singular vectors,

*>                          stored rowwise);

*>          if JOBU .ne. 'O' and JOBVT .ne. 'O', the contents of A

*>                          are destroyed.

*> \endverbatim

*>

*> \param[in] LDA

*> \verbatim

*>          LDA is INTEGER

*>          The leading dimension of the array A.  LDA >= max(1,M).

*> \endverbatim

*>

*> \param[out] S

*> \verbatim

*>          S is DOUBLE PRECISION array, dimension (min(M,N))

*>          The singular values of A, sorted so that S(i) >= S(i+1).

*> \endverbatim

*>

*> \param[out] U

*> \verbatim

*>          U is DOUBLE PRECISION array, dimension (LDU,UCOL)

*>          (LDU,M) if JOBU = 'A' or (LDU,min(M,N)) if JOBU = 'S'.

*>          If JOBU = 'A', U contains the M-by-M orthogonal matrix U;

*>          if JOBU = 'S', U contains the first min(m,n) columns of U

*>          (the left singular vectors, stored columnwise);

*>          if JOBU = 'N' or 'O', U is not referenced.

*> \endverbatim

*>

*> \param[in] LDU

*> \verbatim

*>          LDU is INTEGER

*>          The leading dimension of the array U.  LDU >= 1; if

*>          JOBU = 'S' or 'A', LDU >= M.

*> \endverbatim

*>

*> \param[out] VT

*> \verbatim

*>          VT is DOUBLE PRECISION array, dimension (LDVT,N)

*>          If JOBVT = 'A', VT contains the N-by-N orthogonal matrix

*>          V**T;

*>          if JOBVT = 'S', VT contains the first min(m,n) rows of

*>          V**T (the right singular vectors, stored rowwise);

*>          if JOBVT = 'N' or 'O', VT is not referenced.

*> \endverbatim

*>

*> \param[in] LDVT

*> \verbatim

*>          LDVT is INTEGER

*>          The leading dimension of the array VT.  LDVT >= 1; if

*>          JOBVT = 'A', LDVT >= N; if JOBVT = 'S', LDVT >= min(M,N).

*> \endverbatim

*>

*> \param[out] WORK

*> \verbatim

*>          WORK is DOUBLE PRECISION array, dimension (MAX(1,LWORK))

*>          On exit, if INFO = 0, WORK(1) returns the optimal LWORK;

*>          if INFO > 0, WORK(2:MIN(M,N)) contains the unconverged

*>          superdiagonal elements of an upper bidiagonal matrix B

*>          whose diagonal is in S (not necessarily sorted). B

*>          satisfies A = U * B * VT, so it has the same singular values

*>          as A, and singular vectors related by U and VT.

*> \endverbatim

*>

*> \param[in] LWORK

*> \verbatim

*>          LWORK is INTEGER

*>          The dimension of the array WORK.

*>          LWORK >= MAX(1,5*MIN(M,N)) for the paths (see comments inside code):

*>             - PATH 1  (M much larger than N, JOBU='N')

*>             - PATH 1t (N much larger than M, JOBVT='N')

*>          LWORK >= MAX(1,3*MIN(M,N) + MAX(M,N),5*MIN(M,N)) for the other paths

*>          For good performance, LWORK should generally be larger.

*>

*>          If LWORK = -1, then a workspace query is assumed; the routine

*>          only calculates the optimal size of the WORK array, returns

*>          this value as the first entry of the WORK array, and no error

*>          message related to LWORK is issued by XERBLA.

*> \endverbatim

*>

*> \param[out] INFO

*> \verbatim

*>          INFO is INTEGER

*>          = 0:  successful exit.

*>          < 0:  if INFO = -i, the i-th argument had an illegal value.

*>          > 0:  if DBDSQR did not converge, INFO specifies how many

*>                superdiagonals of an intermediate bidiagonal form B

*>                did not converge to zero. See the description of WORK

*>                above for details.

*> \endverbatim

*

*  Authors:

*  ========

*

*> \author Univ. of Tennessee

*> \author Univ. of California Berkeley

*> \author Univ. of Colorado Denver

*> \author NAG Ltd.

*

*> \ingroup doubleGEsing

*

*  =====================================================================


      SUBROUTINE dgesvd( JOBU, JOBVT, M, N, A, LDA, S, U, LDU,

     $                   VT, LDVT, WORK, LWORK, INFO )

*

*  -- LAPACK driver routine --

*  -- LAPACK is a software package provided by Univ. of Tennessee,    --

*  -- Univ. of California Berkeley, Univ. of Colorado Denver and NAG Ltd..--

*

*     .. Scalar Arguments ..

      CHARACTER          JOBU, JOBVT

      INTEGER            INFO, LDA, LDU, LDVT, LWORK, M, N

*     ..

*     .. Array Arguments ..

      DOUBLE PRECISION   A( LDA, * ), S( * ), U( LDU, * ),

     $                   vt( ldvt, * ), work( * )

*     ..

*

*  =====================================================================

*

*     .. Parameters ..

      DOUBLE PRECISION   ZERO, ONE

      parameter( zero = 0.0d0, one = 1.0d0 )

*     ..

*     .. Local Scalars ..

      LOGICAL            LQUERY, WNTUA, WNTUAS, WNTUN, WNTUO, WNTUS,

     $                   wntva, wntvas, wntvn, wntvo, wntvs

      INTEGER            BDSPAC, BLK, CHUNK, I, IE, IERR, IR, ISCL,

     $                   itau, itaup, itauq, iu, iwork, ldwrkr, ldwrku,

     $                   maxwrk, minmn, minwrk, mnthr, ncu, ncvt, nru,

     $                   nrvt, wrkbl

      INTEGER            LWORK_DGEQRF, LWORK_DORGQR_N, LWORK_DORGQR_M,

     $                   lwork_dgebrd, lwork_dorgbr_p, lwork_dorgbr_q,

     $                   lwork_dgelqf, lwork_dorglq_n, lwork_dorglq_m

      DOUBLE PRECISION   ANRM, BIGNUM, EPS, SMLNUM

*     ..

*     .. Local Arrays ..

      DOUBLE PRECISION   DUM( 1 )

*     ..

*     .. External Subroutines ..

      EXTERNAL           dbdsqr, dgebrd, dgelqf, dgemm, dgeqrf, dlacpy,

     $                   dlascl, dlaset, dorgbr, dorglq, dorgqr, dormbr,

     $                   xerbla

*     ..

*     .. External Functions ..

      LOGICAL            LSAME

      INTEGER            ILAENV

      DOUBLE PRECISION   DLAMCH, DLANGE

      EXTERNAL           lsame, ilaenv, dlamch, dlange

*     ..

*     .. Intrinsic Functions ..

      INTRINSIC          max, min, sqrt

*     ..

*     .. Executable Statements ..

*

*     Test the input arguments

*

      info = 0

      minmn = min( m, n )

      wntua = lsame( jobu, 'A' )

      wntus = lsame( jobu, 'S' )

      wntuas = wntua .OR. wntus

      wntuo = lsame( jobu, 'O' )

      wntun = lsame( jobu, 'N' )

      wntva = lsame( jobvt, 'A' )

      wntvs = lsame( jobvt, 'S' )

      wntvas = wntva .OR. wntvs

      wntvo = lsame( jobvt, 'o' )

      WNTVN = LSAME( JOBVT, 'n' )

.EQ.      LQUERY = ( LWORK-1 )

*

.NOT..OR..OR..OR.      IF( ( WNTUA  WNTUS  WNTUO  WNTUN ) ) THEN

         INFO = -1

.NOT..OR..OR..OR..OR.      ELSE IF( ( WNTVA  WNTVS  WNTVO  WNTVN )

.AND.     $         ( WNTVO  WNTUO ) ) THEN

         INFO = -2

.LT.      ELSE IF( M0 ) THEN

         INFO = -3

.LT.      ELSE IF( N0 ) THEN

         INFO = -4

.LT.      ELSE IF( LDAMAX( 1, M ) ) THEN

         INFO = -6

.LT..OR..AND..LT.      ELSE IF( LDU1  ( WNTUAS  LDUM ) ) THEN

         INFO = -9

.LT..OR..AND..LT..OR.      ELSE IF( LDVT1  ( WNTVA  LDVTN )

.AND..LT.     $         ( WNTVS  LDVTMINMN ) ) THEN

         INFO = -11

      END IF

*

*     Compute workspace

*      (Note: Comments in the code beginning "Workspace:" describe the

*       minimal amount of workspace needed at that point in the code,

*       as well as the preferred amount for good performance.

*       NB refers to the optimal block size for the immediately

*       following subroutine, as returned by ILAENV.)

*

.EQ.      IF( INFO0 ) THEN

         MINWRK = 1

         MAXWRK = 1

.GE..AND..GT.         IF( MN  MINMN0 ) THEN

*

*           Compute space needed for DBDSQR

*

            MNTHR = ILAENV( 6, 'dgesvd', JOBU // JOBVT, M, N, 0, 0 )

            BDSPAC = 5*N

*           Compute space needed for DGEQRF

            CALL DGEQRF( M, N, A, LDA, DUM(1), DUM(1), -1, IERR )

            LWORK_DGEQRF = INT( DUM(1) )

*           Compute space needed for DORGQR

            CALL DORGQR( M, N, N, A, LDA, DUM(1), DUM(1), -1, IERR )

            LWORK_DORGQR_N = INT( DUM(1) )

            CALL DORGQR( M, M, N, A, LDA, DUM(1), DUM(1), -1, IERR )

            LWORK_DORGQR_M = INT( DUM(1) )

*           Compute space needed for DGEBRD

            CALL DGEBRD( N, N, A, LDA, S, DUM(1), DUM(1),

     $                   DUM(1), DUM(1), -1, IERR )

            LWORK_DGEBRD = INT( DUM(1) )

*           Compute space needed for DORGBR P

            CALL DORGBR( 'p', N, N, N, A, LDA, DUM(1),

     $                   DUM(1), -1, IERR )

            LWORK_DORGBR_P = INT( DUM(1) )

*           Compute space needed for DORGBR Q

            CALL DORGBR( 'q', N, N, N, A, LDA, DUM(1),

     $                   DUM(1), -1, IERR )

            LWORK_DORGBR_Q = INT( DUM(1) )

*

.GE.            IF( MMNTHR ) THEN

               IF( WNTUN ) THEN

*

*                 Path 1 (M much larger than N, JOBU='N')

*

                  MAXWRK = N + LWORK_DGEQRF

                  MAXWRK = MAX( MAXWRK, 3*N + LWORK_DGEBRD )

.OR.                  IF( WNTVO  WNTVAS )

     $               MAXWRK = MAX( MAXWRK, 3*N + LWORK_DORGBR_P )

                  MAXWRK = MAX( MAXWRK, BDSPAC )

                  MINWRK = MAX( 4*N, BDSPAC )

.AND.               ELSE IF( WNTUO  WNTVN ) THEN

*

*                 Path 2 (M much larger than N, JOBU='O', JOBVT='N')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_N )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = MAX( N*N + WRKBL, N*N + M*N + N )

                  MINWRK = MAX( 3*N + M, BDSPAC )

.AND.               ELSE IF( WNTUO  WNTVAS ) THEN

*

*                 Path 3 (M much larger than N, JOBU='O', JOBVT='S' or

*                 'A')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_N )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = MAX( N*N + WRKBL, N*N + M*N + N )

                  MINWRK = MAX( 3*N + M, BDSPAC )

.AND.               ELSE IF( WNTUS  WNTVN ) THEN

*

*                 Path 4 (M much larger than N, JOBU='S', JOBVT='N')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_N )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = N*N + WRKBL

                  MINWRK = MAX( 3*N + M, BDSPAC )

.AND.               ELSE IF( WNTUS  WNTVO ) THEN

*

*                 Path 5 (M much larger than N, JOBU='S', JOBVT='O')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_N )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = 2*N*N + WRKBL

                  MINWRK = MAX( 3*N + M, BDSPAC )

.AND.               ELSE IF( WNTUS  WNTVAS ) THEN

*

*                 Path 6 (M much larger than N, JOBU='S', JOBVT='S' or

*                 'A')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_N )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = N*N + WRKBL

                  MINWRK = MAX( 3*N + M, BDSPAC )

.AND.               ELSE IF( WNTUA  WNTVN ) THEN

*

*                 Path 7 (M much larger than N, JOBU='A', JOBVT='N')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_M )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = N*N + WRKBL

                  MINWRK = MAX( 3*N + M, BDSPAC )

.AND.               ELSE IF( WNTUA  WNTVO ) THEN

*

*                 Path 8 (M much larger than N, JOBU='A', JOBVT='O')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_M )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = 2*N*N + WRKBL

                  MINWRK = MAX( 3*N + M, BDSPAC )

.AND.               ELSE IF( WNTUA  WNTVAS ) THEN

*

*                 Path 9 (M much larger than N, JOBU='A', JOBVT='S' or

*                 'A')

*

                  WRKBL = N + LWORK_DGEQRF

                  WRKBL = MAX( WRKBL, N + LWORK_DORGQR_M )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, 3*N + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = N*N + WRKBL

                  MINWRK = MAX( 3*N + M, BDSPAC )

               END IF

            ELSE

*

*              Path 10 (M at least N, but not much larger)

*

               CALL DGEBRD( M, N, A, LDA, S, DUM(1), DUM(1),

     $                   DUM(1), DUM(1), -1, IERR )

               LWORK_DGEBRD = INT( DUM(1) )

               MAXWRK = 3*N + LWORK_DGEBRD

.OR.               IF( WNTUS  WNTUO ) THEN

                  CALL DORGBR( 'q', M, N, N, A, LDA, DUM(1),

     $                   DUM(1), -1, IERR )

                  LWORK_DORGBR_Q = INT( DUM(1) )

                  MAXWRK = MAX( MAXWRK, 3*N + LWORK_DORGBR_Q )

               END IF

               IF( WNTUA ) THEN

                  CALL DORGBR( 'q', M, M, N, A, LDA, DUM(1),

     $                   DUM(1), -1, IERR )

                  LWORK_DORGBR_Q = INT( DUM(1) )

                  MAXWRK = MAX( MAXWRK, 3*N + LWORK_DORGBR_Q )

               END IF

.NOT.               IF( WNTVN ) THEN

                 MAXWRK = MAX( MAXWRK, 3*N + LWORK_DORGBR_P )

               END IF

               MAXWRK = MAX( MAXWRK, BDSPAC )

               MINWRK = MAX( 3*N + M, BDSPAC )

            END IF

.GT.         ELSE IF( MINMN0 ) THEN

*

*           Compute space needed for DBDSQR

*

            MNTHR = ILAENV( 6, 'dgesvd', JOBU // JOBVT, M, N, 0, 0 )

            BDSPAC = 5*M

*           Compute space needed for DGELQF

            CALL DGELQF( M, N, A, LDA, DUM(1), DUM(1), -1, IERR )

            LWORK_DGELQF = INT( DUM(1) )

*           Compute space needed for DORGLQ

            CALL DORGLQ( N, N, M, DUM(1), N, DUM(1), DUM(1), -1, IERR )

            LWORK_DORGLQ_N = INT( DUM(1) )

            CALL DORGLQ( M, N, M, A, LDA, DUM(1), DUM(1), -1, IERR )

            LWORK_DORGLQ_M = INT( DUM(1) )

*           Compute space needed for DGEBRD

            CALL DGEBRD( M, M, A, LDA, S, DUM(1), DUM(1),

     $                   DUM(1), DUM(1), -1, IERR )

            LWORK_DGEBRD = INT( DUM(1) )

*            Compute space needed for DORGBR P

            CALL DORGBR( 'p', M, M, M, A, N, DUM(1),

     $                   DUM(1), -1, IERR )

            LWORK_DORGBR_P = INT( DUM(1) )

*           Compute space needed for DORGBR Q

            CALL DORGBR( 'q', M, M, M, A, N, DUM(1),

     $                   DUM(1), -1, IERR )

            LWORK_DORGBR_Q = INT( DUM(1) )

.GE.            IF( NMNTHR ) THEN

               IF( WNTVN ) THEN

*

*                 Path 1t(N much larger than M, JOBVT='N')

*

                  MAXWRK = M + LWORK_DGELQF

                  MAXWRK = MAX( MAXWRK, 3*M + LWORK_DGEBRD )

.OR.                  IF( WNTUO  WNTUAS )

     $               MAXWRK = MAX( MAXWRK, 3*M + LWORK_DORGBR_Q )

                  MAXWRK = MAX( MAXWRK, BDSPAC )

                  MINWRK = MAX( 4*M, BDSPAC )

.AND.               ELSE IF( WNTVO  WNTUN ) THEN

*

*                 Path 2t(N much larger than M, JOBU='N', JOBVT='O')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_M )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = MAX( M*M + WRKBL, M*M + M*N + M )

                  MINWRK = MAX( 3*M + N, BDSPAC )

.AND.               ELSE IF( WNTVO  WNTUAS ) THEN

*

*                 Path 3t(N much larger than M, JOBU='S' or 'A',

*                 JOBVT='O')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_M )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = MAX( M*M + WRKBL, M*M + M*N + M )

                  MINWRK = MAX( 3*M + N, BDSPAC )

.AND.               ELSE IF( WNTVS  WNTUN ) THEN

*

*                 Path 4t(N much larger than M, JOBU='N', JOBVT='S')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_M )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = M*M + WRKBL

                  MINWRK = MAX( 3*M + N, BDSPAC )

.AND.               ELSE IF( WNTVS  WNTUO ) THEN

*

*                 Path 5t(N much larger than M, JOBU='O', JOBVT='S')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_M )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = 2*M*M + WRKBL

                  MINWRK = MAX( 3*M + N, BDSPAC )

.AND.               ELSE IF( WNTVS  WNTUAS ) THEN

*

*                 Path 6t(N much larger than M, JOBU='S' or 'A',

*                 JOBVT='S')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_M )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = M*M + WRKBL

                  MINWRK = MAX( 3*M + N, BDSPAC )

.AND.               ELSE IF( WNTVA  WNTUN ) THEN

*

*                 Path 7t(N much larger than M, JOBU='N', JOBVT='A')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_N )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = M*M + WRKBL

                  MINWRK = MAX( 3*M + N, BDSPAC )

.AND.               ELSE IF( WNTVA  WNTUO ) THEN

*

*                 Path 8t(N much larger than M, JOBU='O', JOBVT='A')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_N )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = 2*M*M + WRKBL

                  MINWRK = MAX( 3*M + N, BDSPAC )

.AND.               ELSE IF( WNTVA  WNTUAS ) THEN

*

*                 Path 9t(N much larger than M, JOBU='S' or 'A',

*                 JOBVT='A')

*

                  WRKBL = M + LWORK_DGELQF

                  WRKBL = MAX( WRKBL, M + LWORK_DORGLQ_N )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DGEBRD )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_P )

                  WRKBL = MAX( WRKBL, 3*M + LWORK_DORGBR_Q )

                  WRKBL = MAX( WRKBL, BDSPAC )

                  MAXWRK = M*M + WRKBL

                  MINWRK = MAX( 3*M + N, BDSPAC )

               END IF

            ELSE

*

*              Path 10t(N greater than M, but not much larger)

*

               CALL DGEBRD( M, N, A, LDA, S, DUM(1), DUM(1),

     $                   DUM(1), DUM(1), -1, IERR )

               LWORK_DGEBRD = INT( DUM(1) )

               MAXWRK = 3*M + LWORK_DGEBRD

.OR.               IF( WNTVS  WNTVO ) THEN

*                Compute space needed for DORGBR P

                 CALL DORGBR( 'p', M, N, M, A, N, DUM(1),

     $                   DUM(1), -1, IERR )

                 LWORK_DORGBR_P = INT( DUM(1) )

                 MAXWRK = MAX( MAXWRK, 3*M + LWORK_DORGBR_P )

               END IF

               IF( WNTVA ) THEN

                 CALL DORGBR( 'p', N, N, M, A, N, DUM(1),

     $                   DUM(1), -1, IERR )

                 LWORK_DORGBR_P = INT( DUM(1) )

                 MAXWRK = MAX( MAXWRK, 3*M + LWORK_DORGBR_P )

               END IF

.NOT.               IF( WNTUN ) THEN

                  MAXWRK = MAX( MAXWRK, 3*M + LWORK_DORGBR_Q )

               END IF

               MAXWRK = MAX( MAXWRK, BDSPAC )

               MINWRK = MAX( 3*M + N, BDSPAC )

            END IF

         END IF

         MAXWRK = MAX( MAXWRK, MINWRK )

         WORK( 1 ) = MAXWRK

*

.LT..AND..NOT.         IF( LWORKMINWRK  LQUERY ) THEN

            INFO = -13

         END IF

      END IF

*

.NE.      IF( INFO0 ) THEN

         CALL XERBLA( 'dgesvd', -INFO )

         RETURN

      ELSE IF( LQUERY ) THEN

         RETURN

      END IF

*

*     Quick return if possible

*

.EQ..OR..EQ.      IF( M0  N0 ) THEN

         RETURN

      END IF

*

*     Get machine constants

*

      EPS = DLAMCH( 'p' )

      SMLNUM = SQRT( DLAMCH( 's' ) ) / EPS

      BIGNUM = ONE / SMLNUM

*

*     Scale A if max element outside range [SMLNUM,BIGNUM]

*

      ANRM = DLANGE( 'm', M, N, A, LDA, DUM )

      ISCL = 0

.GT..AND..LT.      IF( ANRMZERO  ANRMSMLNUM ) THEN

         ISCL = 1

         CALL DLASCL( 'g', 0, 0, ANRM, SMLNUM, M, N, A, LDA, IERR )

.GT.      ELSE IF( ANRMBIGNUM ) THEN

         ISCL = 1

         CALL DLASCL( 'g', 0, 0, ANRM, BIGNUM, M, N, A, LDA, IERR )

      END IF

*

.GE.      IF( MN ) THEN

*

*        A has at least as many rows as columns. If A has sufficiently

*        more rows than columns, first reduce using the QR

*        decomposition (if sufficient workspace available)

*

.GE.         IF( MMNTHR ) THEN

*

            IF( WNTUN ) THEN

*

*              Path 1 (M much larger than N, JOBU='N')

*              No left singular vectors to be computed

*

               ITAU = 1

               IWORK = ITAU + N

*

*              Compute A=Q*R

*              (Workspace: need 2*N, prefer N + N*NB)

*

               CALL DGEQRF( M, N, A, LDA, WORK( ITAU ), WORK( IWORK ),

     $                      LWORK-IWORK+1, IERR )

*

*              Zero out below R

*

.GT.               IF( N  1 ) THEN

                  CALL DLASET( 'l', N-1, N-1, ZERO, ZERO, A( 2, 1 ),

     $                         LDA )

               END IF

               IE = 1

               ITAUQ = IE + N

               ITAUP = ITAUQ + N

               IWORK = ITAUP + N

*

*              Bidiagonalize R in A

*              (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

               CALL DGEBRD( N, N, A, LDA, S, WORK( IE ), WORK( ITAUQ ),

     $                      WORK( ITAUP ), WORK( IWORK ), LWORK-IWORK+1,

     $                      IERR )

               NCVT = 0

.OR.               IF( WNTVO  WNTVAS ) THEN

*

*                 If right singular vectors desired, generate P'.

*                 (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

                  CALL DORGBR( 'p', N, N, N, A, LDA, WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  NCVT = N

               END IF

               IWORK = IE + N

*

*              Perform bidiagonal QR iteration, computing right

*              singular vectors of A in A if desired

*              (Workspace: need BDSPAC)

*

               CALL DBDSQR( 'u', N, NCVT, 0, 0, S, WORK( IE ), A, LDA,

     $                      DUM, 1, DUM, 1, WORK( IWORK ), INFO )

*

*              If right singular vectors desired in VT, copy them there

*

               IF( WNTVAS )

     $            CALL DLACPY( 'f', N, N, A, LDA, VT, LDVT )

*

.AND.            ELSE IF( WNTUO  WNTVN ) THEN

*

*              Path 2 (M much larger than N, JOBU='O', JOBVT='N')

*              N left singular vectors to be overwritten on A and

*              no right singular vectors to be computed

*

.GE.               IF( LWORKN*N+MAX( 4*N, BDSPAC ) ) THEN

*

*                 Sufficient workspace for a fast algorithm

*

                  IR = 1

.GE.                  IF( LWORKMAX( WRKBL, LDA*N + N ) + LDA*N ) THEN

*

*                    WORK(IU) is LDA by N, WORK(IR) is LDA by N

*

                     LDWRKU = LDA

                     LDWRKR = LDA

.GE.                  ELSE IF( LWORKMAX( WRKBL, LDA*N + N ) + N*N ) THEN

*

*                    WORK(IU) is LDA by N, WORK(IR) is N by N

*

                     LDWRKU = LDA

                     LDWRKR = N

                  ELSE

*

*                    WORK(IU) is LDWRKU by N, WORK(IR) is N by N

*

                     LDWRKU = ( LWORK-N*N-N ) / N

                     LDWRKR = N

                  END IF

                  ITAU = IR + LDWRKR*N

                  IWORK = ITAU + N

*

*                 Compute A=Q*R

*                 (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                  CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Copy R to WORK(IR) and zero out below it

*

                  CALL DLACPY( 'u', N, N, A, LDA, WORK( IR ), LDWRKR )

                  CALL DLASET( 'l', N-1, N-1, ZERO, ZERO, WORK( IR+1 ),

     $                         LDWRKR )

*

*                 Generate Q in A

*                 (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                  CALL DORGQR( M, N, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IE = ITAU

                  ITAUQ = IE + N

                  ITAUP = ITAUQ + N

                  IWORK = ITAUP + N

*

*                 Bidiagonalize R in WORK(IR)

*                 (Workspace: need N*N + 4*N, prefer N*N + 3*N + 2*N*NB)

*

                  CALL DGEBRD( N, N, WORK( IR ), LDWRKR, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Generate left vectors bidiagonalizing R

*                 (Workspace: need N*N + 4*N, prefer N*N + 3*N + N*NB)

*

                  CALL DORGBR( 'q', N, N, N, WORK( IR ), LDWRKR,

     $                         WORK( ITAUQ ), WORK( IWORK ),

     $                         LWORK-IWORK+1, IERR )

                  IWORK = IE + N

*

*                 Perform bidiagonal QR iteration, computing left

*                 singular vectors of R in WORK(IR)

*                 (Workspace: need N*N + BDSPAC)

*

                  CALL DBDSQR( 'u', N, 0, N, 0, S, WORK( IE ), DUM, 1,

     $                         WORK( IR ), LDWRKR, DUM, 1,

     $                         WORK( IWORK ), INFO )

                  IU = IE + N

*

*                 Multiply Q in A by left singular vectors of R in

*                 WORK(IR), storing result in WORK(IU) and copying to A

*                 (Workspace: need N*N + 2*N, prefer N*N + M*N + N)

*

                  DO 10 I = 1, M, LDWRKU

                     CHUNK = MIN( M-I+1, LDWRKU )

                     CALL DGEMM( 'n', 'n', CHUNK, N, N, ONE, A( I, 1 ),

     $                           LDA, WORK( IR ), LDWRKR, ZERO,

     $                           WORK( IU ), LDWRKU )

                     CALL DLACPY( 'f', CHUNK, N, WORK( IU ), LDWRKU,

     $                            A( I, 1 ), LDA )

   10             CONTINUE

*

               ELSE

*

*                 Insufficient workspace for a fast algorithm

*

                  IE = 1

                  ITAUQ = IE + N

                  ITAUP = ITAUQ + N

                  IWORK = ITAUP + N

*

*                 Bidiagonalize A

*                 (Workspace: need 3*N + M, prefer 3*N + (M + N)*NB)

*

                  CALL DGEBRD( M, N, A, LDA, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Generate left vectors bidiagonalizing A

*                 (Workspace: need 4*N, prefer 3*N + N*NB)

*

                  CALL DORGBR( 'q', M, N, N, A, LDA, WORK( ITAUQ ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IWORK = IE + N

*

*                 Perform bidiagonal QR iteration, computing left

*                 singular vectors of A in A

*                 (Workspace: need BDSPAC)

*

                  CALL DBDSQR( 'u', N, 0, M, 0, S, WORK( IE ), DUM, 1,

     $                         A, LDA, DUM, 1, WORK( IWORK ), INFO )

*

               END IF

*

.AND.            ELSE IF( WNTUO  WNTVAS ) THEN

*

*              Path 3 (M much larger than N, JOBU='O', JOBVT='S' or 'A')

*              N left singular vectors to be overwritten on A and

*              N right singular vectors to be computed in VT

*

.GE.               IF( LWORKN*N+MAX( 4*N, BDSPAC ) ) THEN

*

*                 Sufficient workspace for a fast algorithm

*

                  IR = 1

.GE.                  IF( LWORKMAX( WRKBL, LDA*N + N ) + LDA*N ) THEN

*

*                    WORK(IU) is LDA by N and WORK(IR) is LDA by N

*

                     LDWRKU = LDA

                     LDWRKR = LDA

.GE.                  ELSE IF( LWORKMAX( WRKBL, LDA*N + N ) + N*N ) THEN

*

*                    WORK(IU) is LDA by N and WORK(IR) is N by N

*

                     LDWRKU = LDA

                     LDWRKR = N

                  ELSE

*

*                    WORK(IU) is LDWRKU by N and WORK(IR) is N by N

*

                     LDWRKU = ( LWORK-N*N-N ) / N

                     LDWRKR = N

                  END IF

                  ITAU = IR + LDWRKR*N

                  IWORK = ITAU + N

*

*                 Compute A=Q*R

*                 (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                  CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Copy R to VT, zeroing out below it

*

                  CALL DLACPY( 'u', N, N, A, LDA, VT, LDVT )

.GT.                  IF( N1 )

     $               CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                            VT( 2, 1 ), LDVT )

*

*                 Generate Q in A

*                 (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                  CALL DORGQR( M, N, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IE = ITAU

                  ITAUQ = IE + N

                  ITAUP = ITAUQ + N

                  IWORK = ITAUP + N

*

*                 Bidiagonalize R in VT, copying result to WORK(IR)

*                 (Workspace: need N*N + 4*N, prefer N*N + 3*N + 2*N*NB)

*

                  CALL DGEBRD( N, N, VT, LDVT, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  CALL DLACPY( 'l', N, N, VT, LDVT, WORK( IR ), LDWRKR )

*

*                 Generate left vectors bidiagonalizing R in WORK(IR)

*                 (Workspace: need N*N + 4*N, prefer N*N + 3*N + N*NB)

*

                  CALL DORGBR( 'q', N, N, N, WORK( IR ), LDWRKR,

     $                         WORK( ITAUQ ), WORK( IWORK ),

     $                         LWORK-IWORK+1, IERR )

*

*                 Generate right vectors bidiagonalizing R in VT

*                 (Workspace: need N*N + 4*N-1, prefer N*N + 3*N + (N-1)*NB)

*

                  CALL DORGBR( 'p', N, N, N, VT, LDVT, WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IWORK = IE + N

*

*                 Perform bidiagonal QR iteration, computing left

*                 singular vectors of R in WORK(IR) and computing right

*                 singular vectors of R in VT

*                 (Workspace: need N*N + BDSPAC)

*

                  CALL DBDSQR( 'u', N, N, N, 0, S, WORK( IE ), VT, LDVT,

     $                         WORK( IR ), LDWRKR, DUM, 1,

     $                         WORK( IWORK ), INFO )

                  IU = IE + N

*

*                 Multiply Q in A by left singular vectors of R in

*                 WORK(IR), storing result in WORK(IU) and copying to A

*                 (Workspace: need N*N + 2*N, prefer N*N + M*N + N)

*

                  DO 20 I = 1, M, LDWRKU

                     CHUNK = MIN( M-I+1, LDWRKU )

                     CALL DGEMM( 'n', 'n', CHUNK, N, N, ONE, A( I, 1 ),

     $                           LDA, WORK( IR ), LDWRKR, ZERO,

     $                           WORK( IU ), LDWRKU )

                     CALL DLACPY( 'f', CHUNK, N, WORK( IU ), LDWRKU,

     $                            A( I, 1 ), LDA )

   20             CONTINUE

*

               ELSE

*

*                 Insufficient workspace for a fast algorithm

*

                  ITAU = 1

                  IWORK = ITAU + N

*

*                 Compute A=Q*R

*                 (Workspace: need 2*N, prefer N + N*NB)

*

                  CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Copy R to VT, zeroing out below it

*

                  CALL DLACPY( 'u', N, N, A, LDA, VT, LDVT )

.GT.                  IF( N1 )

     $               CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                            VT( 2, 1 ), LDVT )

*

*                 Generate Q in A

*                 (Workspace: need 2*N, prefer N + N*NB)

*

                  CALL DORGQR( M, N, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IE = ITAU

                  ITAUQ = IE + N

                  ITAUP = ITAUQ + N

                  IWORK = ITAUP + N

*

*                 Bidiagonalize R in VT

*                 (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

                  CALL DGEBRD( N, N, VT, LDVT, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Multiply Q in A by left vectors bidiagonalizing R

*                 (Workspace: need 3*N + M, prefer 3*N + M*NB)

*

                  CALL DORMBR( 'q', 'r', 'n', M, N, N, VT, LDVT,

     $                         WORK( ITAUQ ), A, LDA, WORK( IWORK ),

     $                         LWORK-IWORK+1, IERR )

*

*                 Generate right vectors bidiagonalizing R in VT

*                 (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

                  CALL DORGBR( 'p', N, N, N, VT, LDVT, WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IWORK = IE + N

*

*                 Perform bidiagonal QR iteration, computing left

*                 singular vectors of A in A and computing right

*                 singular vectors of A in VT

*                 (Workspace: need BDSPAC)

*

                  CALL DBDSQR( 'u', N, N, M, 0, S, WORK( IE ), VT, LDVT,

     $                         A, LDA, DUM, 1, WORK( IWORK ), INFO )

*

               END IF

*

            ELSE IF( WNTUS ) THEN

*

               IF( WNTVN ) THEN

*

*                 Path 4 (M much larger than N, JOBU='S', JOBVT='N')

*                 N left singular vectors to be computed in U and

*                 no right singular vectors to be computed

*

.GE.                  IF( LWORKN*N+MAX( 4*N, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IR = 1

.GE.                     IF( LWORKWRKBL+LDA*N ) THEN

*

*                       WORK(IR) is LDA by N

*

                        LDWRKR = LDA

                     ELSE

*

*                       WORK(IR) is N by N

*

                        LDWRKR = N

                     END IF

                     ITAU = IR + LDWRKR*N

                     IWORK = ITAU + N

*

*                    Compute A=Q*R

*                    (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy R to WORK(IR), zeroing out below it

*

                     CALL DLACPY( 'u', N, N, A, LDA, WORK( IR ),

     $                            LDWRKR )

                     CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                            WORK( IR+1 ), LDWRKR )

*

*                    Generate Q in A

*                    (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                     CALL DORGQR( M, N, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Bidiagonalize R in WORK(IR)

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + 2*N*NB)

*

                     CALL DGEBRD( N, N, WORK( IR ), LDWRKR, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate left vectors bidiagonalizing R in WORK(IR)

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + N*NB)

*

                     CALL DORGBR( 'q', N, N, N, WORK( IR ), LDWRKR,

     $                            WORK( ITAUQ ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     IWORK = IE + N

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of R in WORK(IR)

*                    (Workspace: need N*N + BDSPAC)

*

                     CALL DBDSQR( 'u', N, 0, N, 0, S, WORK( IE ), DUM,

     $                            1, WORK( IR ), LDWRKR, DUM, 1,

     $                            WORK( IWORK ), INFO )

*

*                    Multiply Q in A by left singular vectors of R in

*                    WORK(IR), storing result in U

*                    (Workspace: need N*N)

*

                     CALL DGEMM( 'n', 'n', M, N, N, ONE, A, LDA,

     $                           WORK( IR ), LDWRKR, ZERO, U, LDU )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + N

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, N, A, LDA, U, LDU )

*

*                    Generate Q in U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL DORGQR( M, N, N, U, LDU, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Zero out below R in A

*

.GT.                     IF( N  1 ) THEN

                        CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                               A( 2, 1 ), LDA )

                     END IF

*

*                    Bidiagonalize R in A

*                    (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

                     CALL DGEBRD( N, N, A, LDA, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply Q in U by left vectors bidiagonalizing R

*                    (Workspace: need 3*N + M, prefer 3*N + M*NB)

*

                     CALL DORMBR( 'q', 'r', 'n', M, N, N, A, LDA,

     $                            WORK( ITAUQ ), U, LDU, WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     IWORK = IE + N

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', N, 0, M, 0, S, WORK( IE ), DUM,

     $                            1, U, LDU, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               ELSE IF( WNTVO ) THEN

*

*                 Path 5 (M much larger than N, JOBU='S', JOBVT='O')

*                 N left singular vectors to be computed in U and

*                 N right singular vectors to be overwritten on A

*

.GE.                  IF( LWORK2*N*N+MAX( 4*N, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IU = 1

.GE.                     IF( LWORKWRKBL+2*LDA*N ) THEN

*

*                       WORK(IU) is LDA by N and WORK(IR) is LDA by N

*

                        LDWRKU = LDA

                        IR = IU + LDWRKU*N

                        LDWRKR = LDA

.GE.                     ELSE IF( LWORKWRKBL+( LDA + N )*N ) THEN

*

*                       WORK(IU) is LDA by N and WORK(IR) is N by N

*

                        LDWRKU = LDA

                        IR = IU + LDWRKU*N

                        LDWRKR = N

                     ELSE

*

*                       WORK(IU) is N by N and WORK(IR) is N by N

*

                        LDWRKU = N

                        IR = IU + LDWRKU*N

                        LDWRKR = N

                     END IF

                     ITAU = IR + LDWRKR*N

                     IWORK = ITAU + N

*

*                    Compute A=Q*R

*                    (Workspace: need 2*N*N + 2*N, prefer 2*N*N + N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy R to WORK(IU), zeroing out below it

*

                     CALL DLACPY( 'u', N, N, A, LDA, WORK( IU ),

     $                            LDWRKU )

                     CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                            WORK( IU+1 ), LDWRKU )

*

*                    Generate Q in A

*                    (Workspace: need 2*N*N + 2*N, prefer 2*N*N + N + N*NB)

*

                     CALL DORGQR( M, N, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Bidiagonalize R in WORK(IU), copying result to

*                    WORK(IR)

*                    (Workspace: need 2*N*N + 4*N,

*                                prefer 2*N*N+3*N+2*N*NB)

*

                     CALL DGEBRD( N, N, WORK( IU ), LDWRKU, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', n, n, work( iu ), ldwrku,

     $                            work( ir ), ldwrkr )

*

*                    Generate left bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need 2*N*N + 4*N, prefer 2*N*N + 3*N + N*NB)

*

                     CALL dorgbr( 'Q', n, n, n, work( iu ), ldwrku,

     $                            work( itauq ), work( iwork ),

     $                            lwork-iwork+1, ierr )

*

*                    Generate right bidiagonalizing vectors in WORK(IR)

*                    (Workspace: need 2*N*N + 4*N-1,

*                                prefer 2*N*N+3*N+(N-1)*NB)

*

                     CALL dorgbr( 'P', n, n, n, work( ir ), ldwrkr,

     $                            work( itaup ), work( iwork ),

     $                            lwork-iwork+1, ierr )

                     iwork = ie + n

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of R in WORK(IU) and computing

*                    right singular vectors of R in WORK(IR)

*                    (Workspace: need 2*N*N + BDSPAC)

*

                     CALL dbdsqr( 'U', n, n, n, 0, s, work( ie ),

     $                            work( ir ), ldwrkr, work( iu ),

     $                            ldwrku, dum, 1, work( iwork ), info )

*

*                    Multiply Q in A by left singular vectors of R in

*                    WORK(IU), storing result in U

*                    (Workspace: need N*N)

*

                     CALL dgemm( 'N', 'n', M, N, N, ONE, A, LDA,

     $                           WORK( IU ), LDWRKU, ZERO, U, LDU )

*

*                    Copy right singular vectors of R to A

*                    (Workspace: need N*N)

*

                     CALL DLACPY( 'f', N, N, WORK( IR ), LDWRKR, A,

     $                            LDA )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + N

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, N, A, LDA, U, LDU )

*

*                    Generate Q in U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL DORGQR( M, N, N, U, LDU, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Zero out below R in A

*

.GT.                     IF( N  1 ) THEN

                        CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                               A( 2, 1 ), LDA )

                     END IF

*

*                    Bidiagonalize R in A

*                    (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

                     CALL DGEBRD( N, N, A, LDA, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply Q in U by left vectors bidiagonalizing R

*                    (Workspace: need 3*N + M, prefer 3*N + M*NB)

*

                     CALL DORMBR( 'q', 'r', 'n', M, N, N, A, LDA,

     $                            WORK( ITAUQ ), U, LDU, WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate right vectors bidiagonalizing R in A

*                    (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

                     CALL DORGBR( 'p', N, N, N, A, LDA, WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + N

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U and computing right

*                    singular vectors of A in A

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', N, N, M, 0, S, WORK( IE ), A,

     $                            LDA, U, LDU, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               ELSE IF( WNTVAS ) THEN

*

*                 Path 6 (M much larger than N, JOBU='S', JOBVT='S'

*                         or 'A')

*                 N left singular vectors to be computed in U and

*                 N right singular vectors to be computed in VT

*

.GE.                  IF( LWORKN*N+MAX( 4*N, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IU = 1

.GE.                     IF( LWORKWRKBL+LDA*N ) THEN

*

*                       WORK(IU) is LDA by N

*

                        LDWRKU = LDA

                     ELSE

*

*                       WORK(IU) is N by N

*

                        LDWRKU = N

                     END IF

                     ITAU = IU + LDWRKU*N

                     IWORK = ITAU + N

*

*                    Compute A=Q*R

*                    (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy R to WORK(IU), zeroing out below it

*

                     CALL DLACPY( 'u', N, N, A, LDA, WORK( IU ),

     $                            LDWRKU )

                     CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                            WORK( IU+1 ), LDWRKU )

*

*                    Generate Q in A

*                    (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                     CALL DORGQR( M, N, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Bidiagonalize R in WORK(IU), copying result to VT

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + 2*N*NB)

*

                     CALL DGEBRD( N, N, WORK( IU ), LDWRKU, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', N, N, WORK( IU ), LDWRKU, VT,

     $                            LDVT )

*

*                    Generate left bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + N*NB)

*

                     CALL DORGBR( 'q', N, N, N, WORK( IU ), LDWRKU,

     $                            WORK( ITAUQ ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate right bidiagonalizing vectors in VT

*                    (Workspace: need N*N + 4*N-1,

*                                prefer N*N+3*N+(N-1)*NB)

*

                     CALL DORGBR( 'p', N, N, N, VT, LDVT, WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + N

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of R in WORK(IU) and computing

*                    right singular vectors of R in VT

*                    (Workspace: need N*N + BDSPAC)

*

                     CALL DBDSQR( 'u', N, N, N, 0, S, WORK( IE ), VT,

     $                            LDVT, WORK( IU ), LDWRKU, DUM, 1,

     $                            WORK( IWORK ), INFO )

*

*                    Multiply Q in A by left singular vectors of R in

*                    WORK(IU), storing result in U

*                    (Workspace: need N*N)

*

                     CALL DGEMM( 'n', 'n', M, N, N, ONE, A, LDA,

     $                           WORK( IU ), LDWRKU, ZERO, U, LDU )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + N

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, N, A, LDA, U, LDU )

*

*                    Generate Q in U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL DORGQR( M, N, N, U, LDU, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy R to VT, zeroing out below it

*

                     CALL DLACPY( 'u', N, N, A, LDA, VT, LDVT )

.GT.                     IF( N1 )

     $                  CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                               VT( 2, 1 ), LDVT )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Bidiagonalize R in VT

*                    (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

                     CALL DGEBRD( N, N, VT, LDVT, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply Q in U by left bidiagonalizing vectors

*                    in VT

*                    (Workspace: need 3*N + M, prefer 3*N + M*NB)

*

                     CALL DORMBR( 'q', 'r', 'n', M, N, N, VT, LDVT,

     $                            WORK( ITAUQ ), U, LDU, WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate right bidiagonalizing vectors in VT

*                    (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

                     CALL DORGBR( 'p', N, N, N, VT, LDVT, WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + N

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U and computing right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', N, N, M, 0, S, WORK( IE ), VT,

     $                            LDVT, U, LDU, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               END IF

*

            ELSE IF( WNTUA ) THEN

*

               IF( WNTVN ) THEN

*

*                 Path 7 (M much larger than N, JOBU='A', JOBVT='N')

*                 M left singular vectors to be computed in U and

*                 no right singular vectors to be computed

*

.GE.                  IF( LWORKN*N+MAX( N+M, 4*N, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IR = 1

.GE.                     IF( LWORKWRKBL+LDA*N ) THEN

*

*                       WORK(IR) is LDA by N

*

                        LDWRKR = LDA

                     ELSE

*

*                       WORK(IR) is N by N

*

                        LDWRKR = N

                     END IF

                     ITAU = IR + LDWRKR*N

                     IWORK = ITAU + N

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, N, A, LDA, U, LDU )

*

*                    Copy R to WORK(IR), zeroing out below it

*

                     CALL DLACPY( 'u', N, N, A, LDA, WORK( IR ),

     $                            LDWRKR )

                     CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                            WORK( IR+1 ), LDWRKR )

*

*                    Generate Q in U

*                    (Workspace: need N*N + N + M, prefer N*N + N + M*NB)

*

                     CALL DORGQR( M, M, N, U, LDU, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Bidiagonalize R in WORK(IR)

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + 2*N*NB)

*

                     CALL DGEBRD( N, N, WORK( IR ), LDWRKR, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in WORK(IR)

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + N*NB)

*

                     CALL DORGBR( 'q', N, N, N, WORK( IR ), LDWRKR,

     $                            WORK( ITAUQ ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     IWORK = IE + N

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of R in WORK(IR)

*                    (Workspace: need N*N + BDSPAC)

*

                     CALL DBDSQR( 'u', N, 0, N, 0, S, WORK( IE ), DUM,

     $                            1, WORK( IR ), LDWRKR, DUM, 1,

     $                            WORK( IWORK ), INFO )

*

*                    Multiply Q in U by left singular vectors of R in

*                    WORK(IR), storing result in A

*                    (Workspace: need N*N)

*

                     CALL DGEMM( 'n', 'n', M, N, N, ONE, U, LDU,

     $                           WORK( IR ), LDWRKR, ZERO, A, LDA )

*

*                    Copy left singular vectors of A from A to U

*

                     CALL DLACPY( 'f', M, N, A, LDA, U, LDU )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + N

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL DGEQRF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, N, A, LDA, U, LDU )

*

*                    Generate Q in U

*                    (Workspace: need N + M, prefer N + M*NB)

*

                     CALL DORGQR( M, M, N, U, LDU, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + N

                     ITAUP = ITAUQ + N

                     IWORK = ITAUP + N

*

*                    Zero out below R in A

*

.GT.                     IF( N  1 ) THEN

                        CALL DLASET( 'l', N-1, N-1, ZERO, ZERO,

     $                                A( 2, 1 ), LDA )

                     END IF

*

*                    Bidiagonalize R in A

*                    (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

                     CALL DGEBRD( N, N, A, LDA, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply Q in U by left bidiagonalizing vectors

*                    in A

*                    (Workspace: need 3*N + M, prefer 3*N + M*NB)

*

                     CALL DORMBR( 'q', 'r', 'n', m, n, n, a, lda,

     $                            work( itauq ), u, ldu, work( iwork ),

     $                            lwork-iwork+1, ierr )

                     iwork = ie + n

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U

*                    (Workspace: need BDSPAC)

*

                     CALL dbdsqr( 'U', n, 0, m, 0, s, work( ie ), dum,

     $                            1, u, ldu, dum, 1, work( iwork ),

     $                            info )

*

                  END IF

*

               ELSE IF( wntvo ) THEN

*

*                 Path 8 (M much larger than N, JOBU='A', JOBVT='O')

*                 M left singular vectors to be computed in U and

*                 N right singular vectors to be overwritten on A

*

                  IF( lwork.GE.2*n*n+max( n+m, 4*n, bdspac ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     iu = 1

                     IF( lwork.GE.wrkbl+2*lda*n ) THEN

*

*                       WORK(IU) is LDA by N and WORK(IR) is LDA by N

*

                        ldwrku = lda

                        ir = iu + ldwrku*n

                        ldwrkr = lda

                     ELSE IF( lwork.GE.wrkbl+( lda + n )*n ) THEN

*

*                       WORK(IU) is LDA by N and WORK(IR) is N by N

*

                        ldwrku = lda

                        ir = iu + ldwrku*n

                        ldwrkr = n

                     ELSE

*

*                       WORK(IU) is N by N and WORK(IR) is N by N

*

                        ldwrku = n

                        ir = iu + ldwrku*n

                        ldwrkr = n

                     END IF

                     itau = ir + ldwrkr*n

                     iwork = itau + n

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need 2*N*N + 2*N, prefer 2*N*N + N + N*NB)

*

                     CALL dgeqrf( m, n, a, lda, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     CALL dlacpy( 'L', m, n, a, lda, u, ldu )

*

*                    Generate Q in U

*                    (Workspace: need 2*N*N + N + M, prefer 2*N*N + N + M*NB)

*

                     CALL dorgqr( m, m, n, u, ldu, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

*

*                    Copy R to WORK(IU), zeroing out below it

*

                     CALL dlacpy( 'U', n, n, a, lda, work( iu ),

     $                            ldwrku )

                     CALL dlaset( 'L', n-1, n-1, zero, zero,

     $                            work( iu+1 ), ldwrku )

                     ie = itau

                     itauq = ie + n

                     itaup = itauq + n

                     iwork = itaup + n

*

*                    Bidiagonalize R in WORK(IU), copying result to

*                    WORK(IR)

*                    (Workspace: need 2*N*N + 4*N,

*                                prefer 2*N*N+3*N+2*N*NB)

*

                     CALL dgebrd( n, n, work( iu ), ldwrku, s,

     $                            work( ie ), work( itauq ),

     $                            work( itaup ), work( iwork ),

     $                            lwork-iwork+1, ierr )

                     CALL dlacpy( 'U', n, n, work( iu ), ldwrku,

     $                            work( ir ), ldwrkr )

*

*                    Generate left bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need 2*N*N + 4*N, prefer 2*N*N + 3*N + N*NB)

*

                     CALL dorgbr( 'Q', n, n, n, work( iu ), ldwrku,

     $                            work( itauq ), work( iwork ),

     $                            lwork-iwork+1, ierr )

*

*                    Generate right bidiagonalizing vectors in WORK(IR)

*                    (Workspace: need 2*N*N + 4*N-1,

*                                prefer 2*N*N+3*N+(N-1)*NB)

*

                     CALL dorgbr( 'P', n, n, n, work( ir ), ldwrkr,

     $                            work( itaup ), work( iwork ),

     $                            lwork-iwork+1, ierr )

                     iwork = ie + n

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of R in WORK(IU) and computing

*                    right singular vectors of R in WORK(IR)

*                    (Workspace: need 2*N*N + BDSPAC)

*

                     CALL dbdsqr( 'U', n, n, n, 0, s, work( ie ),

     $                            work( ir ), ldwrkr, work( iu ),

     $                            ldwrku, dum, 1, work( iwork ), info )

*

*                    Multiply Q in U by left singular vectors of R in

*                    WORK(IU), storing result in A

*                    (Workspace: need N*N)

*

                     CALL dgemm( 'N', 'N', m, n, n, one, u, ldu,

     $                           work( iu ), ldwrku, zero, a, lda )

*

*                    Copy left singular vectors of A from A to U

*

                     CALL dlacpy( 'F', m, n, a, lda, u, ldu )

*

*                    Copy right singular vectors of R from WORK(IR) to A

*

                     CALL dlacpy( 'F', n, n, work( ir ), ldwrkr, a,

     $                            lda )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     itau = 1

                     iwork = itau + n

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL dgeqrf( m, n, a, lda, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     CALL dlacpy( 'L', m, n, a, lda, u, ldu )

*

*                    Generate Q in U

*                    (Workspace: need N + M, prefer N + M*NB)

*

                     CALL dorgqr( m, m, n, u, ldu, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     ie = itau

                     itauq = ie + n

                     itaup = itauq + n

                     iwork = itaup + n

*

*                    Zero out below R in A

*

                     IF( n .GT. 1 ) THEN

                        CALL dlaset( 'L', n-1, n-1, zero, zero,

     $                                a( 2, 1 ), lda )

                     END IF

*

*                    Bidiagonalize R in A

*                    (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

                     CALL dgebrd( n, n, a, lda, s, work( ie ),

     $                            work( itauq ), work( itaup ),

     $                            work( iwork ), lwork-iwork+1, ierr )

*

*                    Multiply Q in U by left bidiagonalizing vectors

*                    in A

*                    (Workspace: need 3*N + M, prefer 3*N + M*NB)

*

                     CALL dormbr( 'Q', 'R', 'N', m, n, n, a, lda,

     $                            work( itauq ), u, ldu, work( iwork ),

     $                            lwork-iwork+1, ierr )

*

*                    Generate right bidiagonalizing vectors in A

*                    (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

                     CALL dorgbr( 'P', n, n, n, a, lda, work( itaup ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     iwork = ie + n

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U and computing right

*                    singular vectors of A in A

*                    (Workspace: need BDSPAC)

*

                     CALL dbdsqr( 'U', n, n, m, 0, s, work( ie ), a,

     $                            lda, u, ldu, dum, 1, work( iwork ),

     $                            info )

*

                  END IF

*

               ELSE IF( wntvas ) THEN

*

*                 Path 9 (M much larger than N, JOBU='A', JOBVT='S'

*                         or 'A')

*                 M left singular vectors to be computed in U and

*                 N right singular vectors to be computed in VT

*

                  IF( lwork.GE.n*n+max( n+m, 4*n, bdspac ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     iu = 1

                     IF( lwork.GE.wrkbl+lda*n ) THEN

*

*                       WORK(IU) is LDA by N

*

                        ldwrku = lda

                     ELSE

*

*                       WORK(IU) is N by N

*

                        ldwrku = n

                     END IF

                     itau = iu + ldwrku*n

                     iwork = itau + n

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need N*N + 2*N, prefer N*N + N + N*NB)

*

                     CALL dgeqrf( m, n, a, lda, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     CALL dlacpy( 'L', m, n, a, lda, u, ldu )

*

*                    Generate Q in U

*                    (Workspace: need N*N + N + M, prefer N*N + N + M*NB)

*

                     CALL dorgqr( m, m, n, u, ldu, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

*

*                    Copy R to WORK(IU), zeroing out below it

*

                     CALL dlacpy( 'U', n, n, a, lda, work( iu ),

     $                            ldwrku )

                     CALL dlaset( 'L', n-1, n-1, zero, zero,

     $                            work( iu+1 ), ldwrku )

                     ie = itau

                     itauq = ie + n

                     itaup = itauq + n

                     iwork = itaup + n

*

*                    Bidiagonalize R in WORK(IU), copying result to VT

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + 2*N*NB)

*

                     CALL dgebrd( n, n, work( iu ), ldwrku, s,

     $                            work( ie ), work( itauq ),

     $                            work( itaup ), work( iwork ),

     $                            lwork-iwork+1, ierr )

                     CALL dlacpy( 'U', n, n, work( iu ), ldwrku, vt,

     $                            ldvt )

*

*                    Generate left bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need N*N + 4*N, prefer N*N + 3*N + N*NB)

*

                     CALL dorgbr( 'Q', n, n, n, work( iu ), ldwrku,

     $                            work( itauq ), work( iwork ),

     $                            lwork-iwork+1, ierr )

*

*                    Generate right bidiagonalizing vectors in VT

*                    (Workspace: need N*N + 4*N-1,

*                                prefer N*N+3*N+(N-1)*NB)

*

                     CALL dorgbr( 'P', n, n, n, vt, ldvt, work( itaup ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     iwork = ie + n

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of R in WORK(IU) and computing

*                    right singular vectors of R in VT

*                    (Workspace: need N*N + BDSPAC)

*

                     CALL dbdsqr( 'U', n, n, n, 0, s, work( ie ), vt,

     $                            ldvt, work( iu ), ldwrku, dum, 1,

     $                            work( iwork ), info )

*

*                    Multiply Q in U by left singular vectors of R in

*                    WORK(IU), storing result in A

*                    (Workspace: need N*N)

*

                     CALL dgemm( 'N', 'N', m, n, n, one, u, ldu,

     $                           work( iu ), ldwrku, zero, a, lda )

*

*                    Copy left singular vectors of A from A to U

*

                     CALL dlacpy( 'F', m, n, a, lda, u, ldu )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     itau = 1

                     iwork = itau + n

*

*                    Compute A=Q*R, copying result to U

*                    (Workspace: need 2*N, prefer N + N*NB)

*

                     CALL dgeqrf( m, n, a, lda, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     CALL dlacpy( 'L', m, n, a, lda, u, ldu )

*

*                    Generate Q in U

*                    (Workspace: need N + M, prefer N + M*NB)

*

                     CALL dorgqr( m, m, n, u, ldu, work( itau ),

     $                            work( iwork ), lwork-iwork+1, ierr )

*

*                    Copy R from A to VT, zeroing out below it

*

                     CALL dlacpy( 'U', n, n, a, lda, vt, ldvt )

                     IF( n.GT.1 )

     $                  CALL dlaset( 'L', n-1, n-1, zero, zero,

     $                               vt( 2, 1 ), ldvt )

                     ie = itau

                     itauq = ie + n

                     itaup = itauq + n

                     iwork = itaup + n

*

*                    Bidiagonalize R in VT

*                    (Workspace: need 4*N, prefer 3*N + 2*N*NB)

*

                     CALL dgebrd( n, n, vt, ldvt, s, work( ie ),

     $                            work( itauq ), work( itaup ),

     $                            work( iwork ), lwork-iwork+1, ierr )

*

*                    Multiply Q in U by left bidiagonalizing vectors

*                    in VT

*                    (Workspace: need 3*N + M, prefer 3*N + M*NB)

*

                     CALL dormbr( 'Q', 'R', 'N', m, n, n, vt, ldvt,

     $                            work( itauq ), u, ldu, work( iwork ),

     $                            lwork-iwork+1, ierr )

*

*                    Generate right bidiagonalizing vectors in VT

*                    (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

                     CALL dorgbr( 'P', n, n, n, vt, ldvt, work( itaup ),

     $                            work( iwork ), lwork-iwork+1, ierr )

                     iwork = ie + n

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U and computing right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL dbdsqr( 'U', n, n, m, 0, s, work( ie ), vt,

     $                            ldvt, u, ldu, dum, 1, work( iwork ),

     $                            info )

*

                  END IF

*

               END IF

*

            END IF

*

         ELSE

*

*           M .LT. MNTHR

*

*           Path 10 (M at least N, but not much larger)

*           Reduce to bidiagonal form without QR decomposition

*

            ie = 1

            itauq = ie + n

            itaup = itauq + n

            iwork = itaup + n

*

*           Bidiagonalize A

*           (Workspace: need 3*N + M, prefer 3*N + (M + N)*NB)

*

            CALL dgebrd( m, n, a, lda, s, work( ie ), work( itauq ),

     $                   work( itaup ), work( iwork ), lwork-iwork+1,

     $                   ierr )

            IF( wntuas ) THEN

*

*              If left singular vectors desired in U, copy result to U

*              and generate left bidiagonalizing vectors in U

*              (Workspace: need 3*N + NCU, prefer 3*N + NCU*NB)

*

               CALL dlacpy( 'L', m, n, a, lda, u, ldu )

               IF( wntus )

     $            ncu = n

               IF( wntua )

     $            ncu = m

               CALL dorgbr( 'Q', m, ncu, n, u, ldu, work( itauq ),

     $                      work( iwork ), lwork-iwork+1, ierr )

            END IF

            IF( wntvas ) THEN

*

*              If right singular vectors desired in VT, copy result to

*              VT and generate right bidiagonalizing vectors in VT

*              (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

               CALL dlacpy( 'U', n, n, a, lda, vt, ldvt )

               CALL dorgbr( 'P', n, n, n, vt, ldvt, work( itaup ),

     $                      work( iwork ), lwork-iwork+1, ierr )

            END IF

            IF( wntuo ) THEN

*

*              If left singular vectors desired in A, generate left

*              bidiagonalizing vectors in A

*              (Workspace: need 4*N, prefer 3*N + N*NB)

*

               CALL dorgbr( 'Q', m, n, n, a, lda, work( itauq ),

     $                      work( iwork ), lwork-iwork+1, ierr )

            END IF

            IF( wntvo ) THEN

*

*              If right singular vectors desired in A, generate right

*              bidiagonalizing vectors in A

*              (Workspace: need 4*N-1, prefer 3*N + (N-1)*NB)

*

               CALL dorgbr( 'P', n, n, n, a, lda, work( itaup ),

     $                      work( iwork ), lwork-iwork+1, ierr )

            END IF

            iwork = ie + n

            IF( wntuas .OR. wntuo )

     $         nru = m

            IF( wntun )

     $         nru = 0

            IF( wntvas .OR. wntvo )

     $         ncvt = n

            IF( wntvn )

     $         ncvt = 0

            IF( ( .NOT.wntuo ) .AND. ( .NOT.wntvo ) ) THEN

*

*              Perform bidiagonal QR iteration, if desired, computing

*              left singular vectors in U and computing right singular

*              vectors in VT

*              (Workspace: need BDSPAC)

*

               CALL dbdsqr( 'u', N, NCVT, NRU, 0, S, WORK( IE ), VT,

     $                      LDVT, U, LDU, DUM, 1, WORK( IWORK ), INFO )

.NOT..AND.            ELSE IF( ( WNTUO )  WNTVO ) THEN

*

*              Perform bidiagonal QR iteration, if desired, computing

*              left singular vectors in U and computing right singular

*              vectors in A

*              (Workspace: need BDSPAC)

*

               CALL DBDSQR( 'u', N, NCVT, NRU, 0, S, WORK( IE ), A, LDA,

     $                      U, LDU, DUM, 1, WORK( IWORK ), INFO )

            ELSE

*

*              Perform bidiagonal QR iteration, if desired, computing

*              left singular vectors in A and computing right singular

*              vectors in VT

*              (Workspace: need BDSPAC)

*

               CALL DBDSQR( 'u', N, NCVT, NRU, 0, S, WORK( IE ), VT,

     $                      LDVT, A, LDA, DUM, 1, WORK( IWORK ), INFO )

            END IF

*

         END IF

*

      ELSE

*

*        A has more columns than rows. If A has sufficiently more

*        columns than rows, first reduce using the LQ decomposition (if

*        sufficient workspace available)

*

.GE.         IF( NMNTHR ) THEN

*

            IF( WNTVN ) THEN

*

*              Path 1t(N much larger than M, JOBVT='N')

*              No right singular vectors to be computed

*

               ITAU = 1

               IWORK = ITAU + M

*

*              Compute A=L*Q

*              (Workspace: need 2*M, prefer M + M*NB)

*

               CALL DGELQF( M, N, A, LDA, WORK( ITAU ), WORK( IWORK ),

     $                      LWORK-IWORK+1, IERR )

*

*              Zero out above L

*

               CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, A( 1, 2 ), LDA )

               IE = 1

               ITAUQ = IE + M

               ITAUP = ITAUQ + M

               IWORK = ITAUP + M

*

*              Bidiagonalize L in A

*              (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

               CALL DGEBRD( M, M, A, LDA, S, WORK( IE ), WORK( ITAUQ ),

     $                      WORK( ITAUP ), WORK( IWORK ), LWORK-IWORK+1,

     $                      IERR )

.OR.               IF( WNTUO  WNTUAS ) THEN

*

*                 If left singular vectors desired, generate Q

*                 (Workspace: need 4*M, prefer 3*M + M*NB)

*

                  CALL DORGBR( 'q', M, M, M, A, LDA, WORK( ITAUQ ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

               END IF

               IWORK = IE + M

               NRU = 0

.OR.               IF( WNTUO  WNTUAS )

     $            NRU = M

*

*              Perform bidiagonal QR iteration, computing left singular

*              vectors of A in A if desired

*              (Workspace: need BDSPAC)

*

               CALL DBDSQR( 'u', M, 0, NRU, 0, S, WORK( IE ), DUM, 1, A,

     $                      LDA, DUM, 1, WORK( IWORK ), INFO )

*

*              If left singular vectors desired in U, copy them there

*

               IF( WNTUAS )

     $            CALL DLACPY( 'f', M, M, A, LDA, U, LDU )

*

.AND.            ELSE IF( WNTVO  WNTUN ) THEN

*

*              Path 2t(N much larger than M, JOBU='N', JOBVT='O')

*              M right singular vectors to be overwritten on A and

*              no left singular vectors to be computed

*

.GE.               IF( LWORKM*M+MAX( 4*M, BDSPAC ) ) THEN

*

*                 Sufficient workspace for a fast algorithm

*

                  IR = 1

.GE.                  IF( LWORKMAX( WRKBL, LDA*N + M ) + LDA*M ) THEN

*

*                    WORK(IU) is LDA by N and WORK(IR) is LDA by M

*

                     LDWRKU = LDA

                     CHUNK = N

                     LDWRKR = LDA

.GE.                  ELSE IF( LWORKMAX( WRKBL, LDA*N + M ) + M*M ) THEN

*

*                    WORK(IU) is LDA by N and WORK(IR) is M by M

*

                     LDWRKU = LDA

                     CHUNK = N

                     LDWRKR = M

                  ELSE

*

*                    WORK(IU) is M by CHUNK and WORK(IR) is M by M

*

                     LDWRKU = M

                     CHUNK = ( LWORK-M*M-M ) / M

                     LDWRKR = M

                  END IF

                  ITAU = IR + LDWRKR*M

                  IWORK = ITAU + M

*

*                 Compute A=L*Q

*                 (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                  CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Copy L to WORK(IR) and zero out above it

*

                  CALL DLACPY( 'l', M, M, A, LDA, WORK( IR ), LDWRKR )

                  CALL DLASET( 'u', M-1, M-1, ZERO, ZERO,

     $                         WORK( IR+LDWRKR ), LDWRKR )

*

*                 Generate Q in A

*                 (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                  CALL DORGLQ( M, N, M, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IE = ITAU

                  ITAUQ = IE + M

                  ITAUP = ITAUQ + M

                  IWORK = ITAUP + M

*

*                 Bidiagonalize L in WORK(IR)

*                 (Workspace: need M*M + 4*M, prefer M*M + 3*M + 2*M*NB)

*

                  CALL DGEBRD( M, M, WORK( IR ), LDWRKR, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Generate right vectors bidiagonalizing L

*                 (Workspace: need M*M + 4*M-1, prefer M*M + 3*M + (M-1)*NB)

*

                  CALL DORGBR( 'p', M, M, M, WORK( IR ), LDWRKR,

     $                         WORK( ITAUP ), WORK( IWORK ),

     $                         LWORK-IWORK+1, IERR )

                  IWORK = IE + M

*

*                 Perform bidiagonal QR iteration, computing right

*                 singular vectors of L in WORK(IR)

*                 (Workspace: need M*M + BDSPAC)

*

                  CALL DBDSQR( 'u', M, M, 0, 0, S, WORK( IE ),

     $                         WORK( IR ), LDWRKR, DUM, 1, DUM, 1,

     $                         WORK( IWORK ), INFO )

                  IU = IE + M

*

*                 Multiply right singular vectors of L in WORK(IR) by Q

*                 in A, storing result in WORK(IU) and copying to A

*                 (Workspace: need M*M + 2*M, prefer M*M + M*N + M)

*

                  DO 30 I = 1, N, CHUNK

                     BLK = MIN( N-I+1, CHUNK )

                     CALL DGEMM( 'n', 'n', M, BLK, M, ONE, WORK( IR ),

     $                           LDWRKR, A( 1, I ), LDA, ZERO,

     $                           WORK( IU ), LDWRKU )

                     CALL DLACPY( 'f', M, BLK, WORK( IU ), LDWRKU,

     $                            A( 1, I ), LDA )

   30             CONTINUE

*

               ELSE

*

*                 Insufficient workspace for a fast algorithm

*

                  IE = 1

                  ITAUQ = IE + M

                  ITAUP = ITAUQ + M

                  IWORK = ITAUP + M

*

*                 Bidiagonalize A

*                 (Workspace: need 3*M + N, prefer 3*M + (M + N)*NB)

*

                  CALL DGEBRD( M, N, A, LDA, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Generate right vectors bidiagonalizing A

*                 (Workspace: need 4*M, prefer 3*M + M*NB)

*

                  CALL DORGBR( 'p', M, N, M, A, LDA, WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IWORK = IE + M

*

*                 Perform bidiagonal QR iteration, computing right

*                 singular vectors of A in A

*                 (Workspace: need BDSPAC)

*

                  CALL DBDSQR( 'l', M, N, 0, 0, S, WORK( IE ), A, LDA,

     $                         DUM, 1, DUM, 1, WORK( IWORK ), INFO )

*

               END IF

*

.AND.            ELSE IF( WNTVO  WNTUAS ) THEN

*

*              Path 3t(N much larger than M, JOBU='S' or 'A', JOBVT='O')

*              M right singular vectors to be overwritten on A and

*              M left singular vectors to be computed in U

*

.GE.               IF( LWORKM*M+MAX( 4*M, BDSPAC ) ) THEN

*

*                 Sufficient workspace for a fast algorithm

*

                  IR = 1

.GE.                  IF( LWORKMAX( WRKBL, LDA*N + M ) + LDA*M ) THEN

*

*                    WORK(IU) is LDA by N and WORK(IR) is LDA by M

*

                     LDWRKU = LDA

                     CHUNK = N

                     LDWRKR = LDA

.GE.                  ELSE IF( LWORKMAX( WRKBL, LDA*N + M ) + M*M ) THEN

*

*                    WORK(IU) is LDA by N and WORK(IR) is M by M

*

                     LDWRKU = LDA

                     CHUNK = N

                     LDWRKR = M

                  ELSE

*

*                    WORK(IU) is M by CHUNK and WORK(IR) is M by M

*

                     LDWRKU = M

                     CHUNK = ( LWORK-M*M-M ) / M

                     LDWRKR = M

                  END IF

                  ITAU = IR + LDWRKR*M

                  IWORK = ITAU + M

*

*                 Compute A=L*Q

*                 (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                  CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Copy L to U, zeroing about above it

*

                  CALL DLACPY( 'l', M, M, A, LDA, U, LDU )

                  CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, U( 1, 2 ),

     $                         LDU )

*

*                 Generate Q in A

*                 (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                  CALL DORGLQ( M, N, M, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IE = ITAU

                  ITAUQ = IE + M

                  ITAUP = ITAUQ + M

                  IWORK = ITAUP + M

*

*                 Bidiagonalize L in U, copying result to WORK(IR)

*                 (Workspace: need M*M + 4*M, prefer M*M + 3*M + 2*M*NB)

*

                  CALL DGEBRD( M, M, U, LDU, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  CALL DLACPY( 'u', M, M, U, LDU, WORK( IR ), LDWRKR )

*

*                 Generate right vectors bidiagonalizing L in WORK(IR)

*                 (Workspace: need M*M + 4*M-1, prefer M*M + 3*M + (M-1)*NB)

*

                  CALL DORGBR( 'p', M, M, M, WORK( IR ), LDWRKR,

     $                         WORK( ITAUP ), WORK( IWORK ),

     $                         LWORK-IWORK+1, IERR )

*

*                 Generate left vectors bidiagonalizing L in U

*                 (Workspace: need M*M + 4*M, prefer M*M + 3*M + M*NB)

*

                  CALL DORGBR( 'q', M, M, M, U, LDU, WORK( ITAUQ ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IWORK = IE + M

*

*                 Perform bidiagonal QR iteration, computing left

*                 singular vectors of L in U, and computing right

*                 singular vectors of L in WORK(IR)

*                 (Workspace: need M*M + BDSPAC)

*

                  CALL DBDSQR( 'u', M, M, M, 0, S, WORK( IE ),

     $                         WORK( IR ), LDWRKR, U, LDU, DUM, 1,

     $                         WORK( IWORK ), INFO )

                  IU = IE + M

*

*                 Multiply right singular vectors of L in WORK(IR) by Q

*                 in A, storing result in WORK(IU) and copying to A

*                 (Workspace: need M*M + 2*M, prefer M*M + M*N + M))

*

                  DO 40 I = 1, N, CHUNK

                     BLK = MIN( N-I+1, CHUNK )

                     CALL DGEMM( 'n', 'n', M, BLK, M, ONE, WORK( IR ),

     $                           LDWRKR, A( 1, I ), LDA, ZERO,

     $                           WORK( IU ), LDWRKU )

                     CALL DLACPY( 'f', M, BLK, WORK( IU ), LDWRKU,

     $                            A( 1, I ), LDA )

   40             CONTINUE

*

               ELSE

*

*                 Insufficient workspace for a fast algorithm

*

                  ITAU = 1

                  IWORK = ITAU + M

*

*                 Compute A=L*Q

*                 (Workspace: need 2*M, prefer M + M*NB)

*

                  CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Copy L to U, zeroing out above it

*

                  CALL DLACPY( 'l', M, M, A, LDA, U, LDU )

                  CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, U( 1, 2 ),

     $                         LDU )

*

*                 Generate Q in A

*                 (Workspace: need 2*M, prefer M + M*NB)

*

                  CALL DORGLQ( M, N, M, A, LDA, WORK( ITAU ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IE = ITAU

                  ITAUQ = IE + M

                  ITAUP = ITAUQ + M

                  IWORK = ITAUP + M

*

*                 Bidiagonalize L in U

*                 (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

                  CALL DGEBRD( M, M, U, LDU, S, WORK( IE ),

     $                         WORK( ITAUQ ), WORK( ITAUP ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                 Multiply right vectors bidiagonalizing L by Q in A

*                 (Workspace: need 3*M + N, prefer 3*M + N*NB)

*

                  CALL DORMBR( 'p', 'l', 't', M, N, M, U, LDU,

     $                         WORK( ITAUP ), A, LDA, WORK( IWORK ),

     $                         LWORK-IWORK+1, IERR )

*

*                 Generate left vectors bidiagonalizing L in U

*                 (Workspace: need 4*M, prefer 3*M + M*NB)

*

                  CALL DORGBR( 'q', M, M, M, U, LDU, WORK( ITAUQ ),

     $                         WORK( IWORK ), LWORK-IWORK+1, IERR )

                  IWORK = IE + M

*

*                 Perform bidiagonal QR iteration, computing left

*                 singular vectors of A in U and computing right

*                 singular vectors of A in A

*                 (Workspace: need BDSPAC)

*

                  CALL DBDSQR( 'u', M, N, M, 0, S, WORK( IE ), A, LDA,

     $                         U, LDU, DUM, 1, WORK( IWORK ), INFO )

*

               END IF

*

            ELSE IF( WNTVS ) THEN

*

               IF( WNTUN ) THEN

*

*                 Path 4t(N much larger than M, JOBU='N', JOBVT='S')

*                 M right singular vectors to be computed in VT and

*                 no left singular vectors to be computed

*

.GE.                  IF( LWORKM*M+MAX( 4*M, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IR = 1

.GE.                     IF( LWORKWRKBL+LDA*M ) THEN

*

*                       WORK(IR) is LDA by M

*

                        LDWRKR = LDA

                     ELSE

*

*                       WORK(IR) is M by M

*

                        LDWRKR = M

                     END IF

                     ITAU = IR + LDWRKR*M

                     IWORK = ITAU + M

*

*                    Compute A=L*Q

*                    (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy L to WORK(IR), zeroing out above it

*

                     CALL DLACPY( 'l', M, M, A, LDA, WORK( IR ),

     $                            LDWRKR )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO,

     $                            WORK( IR+LDWRKR ), LDWRKR )

*

*                    Generate Q in A

*                    (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                     CALL DORGLQ( M, N, M, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in WORK(IR)

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, WORK( IR ), LDWRKR, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate right vectors bidiagonalizing L in

*                    WORK(IR)

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + (M-1)*NB)

*

                     CALL DORGBR( 'p', M, M, M, WORK( IR ), LDWRKR,

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing right

*                    singular vectors of L in WORK(IR)

*                    (Workspace: need M*M + BDSPAC)

*

                     CALL DBDSQR( 'u', M, M, 0, 0, S, WORK( IE ),

     $                            WORK( IR ), LDWRKR, DUM, 1, DUM, 1,

     $                            WORK( IWORK ), INFO )

*

*                    Multiply right singular vectors of L in WORK(IR) by

*                    Q in A, storing result in VT

*                    (Workspace: need M*M)

*

                     CALL DGEMM( 'n', 'n', M, N, M, ONE, WORK( IR ),

     $                           LDWRKR, A, LDA, ZERO, VT, LDVT )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + M

*

*                    Compute A=L*Q

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy result to VT

*

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DORGLQ( M, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Zero out above L in A

*

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, A( 1, 2 ),

     $                            LDA )

*

*                    Bidiagonalize L in A

*                    (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, A, LDA, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply right vectors bidiagonalizing L by Q in VT

*                    (Workspace: need 3*M + N, prefer 3*M + N*NB)

*

                     CALL DORMBR( 'p', 'l', 't', M, N, M, A, LDA,

     $                            WORK( ITAUP ), VT, LDVT,

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', M, N, 0, 0, S, WORK( IE ), VT,

     $                            LDVT, DUM, 1, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               ELSE IF( WNTUO ) THEN

*

*                 Path 5t(N much larger than M, JOBU='O', JOBVT='S')

*                 M right singular vectors to be computed in VT and

*                 M left singular vectors to be overwritten on A

*

.GE.                  IF( LWORK2*M*M+MAX( 4*M, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IU = 1

.GE.                     IF( LWORKWRKBL+2*LDA*M ) THEN

*

*                       WORK(IU) is LDA by M and WORK(IR) is LDA by M

*

                        LDWRKU = LDA

                        IR = IU + LDWRKU*M

                        LDWRKR = LDA

.GE.                     ELSE IF( LWORKWRKBL+( LDA + M )*M ) THEN

*

*                       WORK(IU) is LDA by M and WORK(IR) is M by M

*

                        LDWRKU = LDA

                        IR = IU + LDWRKU*M

                        LDWRKR = M

                     ELSE

*

*                       WORK(IU) is M by M and WORK(IR) is M by M

*

                        LDWRKU = M

                        IR = IU + LDWRKU*M

                        LDWRKR = M

                     END IF

                     ITAU = IR + LDWRKR*M

                     IWORK = ITAU + M

*

*                    Compute A=L*Q

*                    (Workspace: need 2*M*M + 2*M, prefer 2*M*M + M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy L to WORK(IU), zeroing out below it

*

                     CALL DLACPY( 'l', M, M, A, LDA, WORK( IU ),

     $                            LDWRKU )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO,

     $                            WORK( IU+LDWRKU ), LDWRKU )

*

*                    Generate Q in A

*                    (Workspace: need 2*M*M + 2*M, prefer 2*M*M + M + M*NB)

*

                     CALL DORGLQ( M, N, M, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in WORK(IU), copying result to

*                    WORK(IR)

*                    (Workspace: need 2*M*M + 4*M,

*                                prefer 2*M*M+3*M+2*M*NB)

*

                     CALL DGEBRD( M, M, WORK( IU ), LDWRKU, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, M, WORK( IU ), LDWRKU,

     $                            WORK( IR ), LDWRKR )

*

*                    Generate right bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need 2*M*M + 4*M-1,

*                                prefer 2*M*M+3*M+(M-1)*NB)

*

                     CALL DORGBR( 'p', M, M, M, WORK( IU ), LDWRKU,

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in WORK(IR)

*                    (Workspace: need 2*M*M + 4*M, prefer 2*M*M + 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, WORK( IR ), LDWRKR,

     $                            WORK( ITAUQ ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of L in WORK(IR) and computing

*                    right singular vectors of L in WORK(IU)

*                    (Workspace: need 2*M*M + BDSPAC)

*

                     CALL DBDSQR( 'u', M, M, M, 0, S, WORK( IE ),

     $                            WORK( IU ), LDWRKU, WORK( IR ),

     $                            LDWRKR, DUM, 1, WORK( IWORK ), INFO )

*

*                    Multiply right singular vectors of L in WORK(IU) by

*                    Q in A, storing result in VT

*                    (Workspace: need M*M)

*

                     CALL DGEMM( 'n', 'n', M, N, M, ONE, WORK( IU ),

     $                           LDWRKU, A, LDA, ZERO, VT, LDVT )

*

*                    Copy left singular vectors of L to A

*                    (Workspace: need M*M)

*

                     CALL DLACPY( 'f', M, M, WORK( IR ), LDWRKR, A,

     $                            LDA )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DORGLQ( M, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Zero out above L in A

*

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, A( 1, 2 ),

     $                            LDA )

*

*                    Bidiagonalize L in A

*                    (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, A, LDA, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply right vectors bidiagonalizing L by Q in VT

*                    (Workspace: need 3*M + N, prefer 3*M + N*NB)

*

                     CALL DORMBR( 'p', 'l', 't', M, N, M, A, LDA,

     $                            WORK( ITAUP ), VT, LDVT,

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors of L in A

*                    (Workspace: need 4*M, prefer 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, A, LDA, WORK( ITAUQ ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, compute left

*                    singular vectors of A in A and compute right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', M, N, M, 0, S, WORK( IE ), VT,

     $                            LDVT, A, LDA, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               ELSE IF( WNTUAS ) THEN

*

*                 Path 6t(N much larger than M, JOBU='S' or 'A',

*                         JOBVT='S')

*                 M right singular vectors to be computed in VT and

*                 M left singular vectors to be computed in U

*

.GE.                  IF( LWORKM*M+MAX( 4*M, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IU = 1

.GE.                     IF( LWORKWRKBL+LDA*M ) THEN

*

*                       WORK(IU) is LDA by N

*

                        LDWRKU = LDA

                     ELSE

*

*                       WORK(IU) is LDA by M

*

                        LDWRKU = M

                     END IF

                     ITAU = IU + LDWRKU*M

                     IWORK = ITAU + M

*

*                    Compute A=L*Q

*                    (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy L to WORK(IU), zeroing out above it

*

                     CALL DLACPY( 'l', M, M, A, LDA, WORK( IU ),

     $                            LDWRKU )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO,

     $                            WORK( IU+LDWRKU ), LDWRKU )

*

*                    Generate Q in A

*                    (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                     CALL DORGLQ( M, N, M, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in WORK(IU), copying result to U

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, WORK( IU ), LDWRKU, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, M, WORK( IU ), LDWRKU, U,

     $                            LDU )

*

*                    Generate right bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need M*M + 4*M-1,

*                                prefer M*M+3*M+(M-1)*NB)

*

                     CALL DORGBR( 'p', M, M, M, WORK( IU ), LDWRKU,

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in U

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, U, LDU, WORK( ITAUQ ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of L in U and computing right

*                    singular vectors of L in WORK(IU)

*                    (Workspace: need M*M + BDSPAC)

*

                     CALL DBDSQR( 'u', M, M, M, 0, S, WORK( IE ),

     $                            WORK( IU ), LDWRKU, U, LDU, DUM, 1,

     $                            WORK( IWORK ), INFO )

*

*                    Multiply right singular vectors of L in WORK(IU) by

*                    Q in A, storing result in VT

*                    (Workspace: need M*M)

*

                     CALL DGEMM( 'n', 'n', M, N, M, ONE, WORK( IU ),

     $                           LDWRKU, A, LDA, ZERO, VT, LDVT )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DORGLQ( M, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy L to U, zeroing out above it

*

                     CALL DLACPY( 'l', M, M, A, LDA, U, LDU )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, U( 1, 2 ),

     $                            LDU )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in U

*                    (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, U, LDU, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply right bidiagonalizing vectors in U by Q

*                    in VT

*                    (Workspace: need 3*M + N, prefer 3*M + N*NB)

*

                     CALL DORMBR( 'p', 'l', 't', M, N, M, U, LDU,

     $                            WORK( ITAUP ), VT, LDVT,

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in U

*                    (Workspace: need 4*M, prefer 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, U, LDU, WORK( ITAUQ ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U and computing right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', M, N, M, 0, S, WORK( IE ), VT,

     $                            LDVT, U, LDU, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               END IF

*

            ELSE IF( WNTVA ) THEN

*

               IF( WNTUN ) THEN

*

*                 Path 7t(N much larger than M, JOBU='N', JOBVT='A')

*                 N right singular vectors to be computed in VT and

*                 no left singular vectors to be computed

*

.GE.                  IF( LWORKM*M+MAX( N + M, 4*M, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IR = 1

.GE.                     IF( LWORKWRKBL+LDA*M ) THEN

*

*                       WORK(IR) is LDA by M

*

                        LDWRKR = LDA

                     ELSE

*

*                       WORK(IR) is M by M

*

                        LDWRKR = M

                     END IF

                     ITAU = IR + LDWRKR*M

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Copy L to WORK(IR), zeroing out above it

*

                     CALL DLACPY( 'l', M, M, A, LDA, WORK( IR ),

     $                            LDWRKR )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO,

     $                            WORK( IR+LDWRKR ), LDWRKR )

*

*                    Generate Q in VT

*                    (Workspace: need M*M + M + N, prefer M*M + M + N*NB)

*

                     CALL DORGLQ( N, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in WORK(IR)

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, WORK( IR ), LDWRKR, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate right bidiagonalizing vectors in WORK(IR)

*                    (Workspace: need M*M + 4*M-1,

*                                prefer M*M+3*M+(M-1)*NB)

*

                     CALL DORGBR( 'p', M, M, M, WORK( IR ), LDWRKR,

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing right

*                    singular vectors of L in WORK(IR)

*                    (Workspace: need M*M + BDSPAC)

*

                     CALL DBDSQR( 'u', M, M, 0, 0, S, WORK( IE ),

     $                            WORK( IR ), LDWRKR, DUM, 1, DUM, 1,

     $                            WORK( IWORK ), INFO )

*

*                    Multiply right singular vectors of L in WORK(IR) by

*                    Q in VT, storing result in A

*                    (Workspace: need M*M)

*

                     CALL DGEMM( 'n', 'n', M, N, M, ONE, WORK( IR ),

     $                           LDWRKR, VT, LDVT, ZERO, A, LDA )

*

*                    Copy right singular vectors of A from A to VT

*

                     CALL DLACPY( 'f', M, N, A, LDA, VT, LDVT )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need M + N, prefer M + N*NB)

*

                     CALL DORGLQ( N, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Zero out above L in A

*

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, A( 1, 2 ),

     $                            LDA )

*

*                    Bidiagonalize L in A

*                    (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, A, LDA, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply right bidiagonalizing vectors in A by Q

*                    in VT

*                    (Workspace: need 3*M + N, prefer 3*M + N*NB)

*

                     CALL DORMBR( 'p', 'l', 't', M, N, M, A, LDA,

     $                            WORK( ITAUP ), VT, LDVT,

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', M, N, 0, 0, S, WORK( IE ), VT,

     $                            LDVT, DUM, 1, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               ELSE IF( WNTUO ) THEN

*

*                 Path 8t(N much larger than M, JOBU='O', JOBVT='A')

*                 N right singular vectors to be computed in VT and

*                 M left singular vectors to be overwritten on A

*

.GE.                  IF( LWORK2*M*M+MAX( N + M, 4*M, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IU = 1

.GE.                     IF( LWORKWRKBL+2*LDA*M ) THEN

*

*                       WORK(IU) is LDA by M and WORK(IR) is LDA by M

*

                        LDWRKU = LDA

                        IR = IU + LDWRKU*M

                        LDWRKR = LDA

.GE.                     ELSE IF( LWORKWRKBL+( LDA + M )*M ) THEN

*

*                       WORK(IU) is LDA by M and WORK(IR) is M by M

*

                        LDWRKU = LDA

                        IR = IU + LDWRKU*M

                        LDWRKR = M

                     ELSE

*

*                       WORK(IU) is M by M and WORK(IR) is M by M

*

                        LDWRKU = M

                        IR = IU + LDWRKU*M

                        LDWRKR = M

                     END IF

                     ITAU = IR + LDWRKR*M

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need 2*M*M + 2*M, prefer 2*M*M + M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need 2*M*M + M + N, prefer 2*M*M + M + N*NB)

*

                     CALL DORGLQ( N, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy L to WORK(IU), zeroing out above it

*

                     CALL DLACPY( 'l', M, M, A, LDA, WORK( IU ),

     $                            LDWRKU )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO,

     $                            WORK( IU+LDWRKU ), LDWRKU )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in WORK(IU), copying result to

*                    WORK(IR)

*                    (Workspace: need 2*M*M + 4*M,

*                                prefer 2*M*M+3*M+2*M*NB)

*

                     CALL DGEBRD( M, M, WORK( IU ), LDWRKU, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, M, WORK( IU ), LDWRKU,

     $                            WORK( IR ), LDWRKR )

*

*                    Generate right bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need 2*M*M + 4*M-1,

*                                prefer 2*M*M+3*M+(M-1)*NB)

*

                     CALL DORGBR( 'p', M, M, M, WORK( IU ), LDWRKU,

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in WORK(IR)

*                    (Workspace: need 2*M*M + 4*M, prefer 2*M*M + 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, WORK( IR ), LDWRKR,

     $                            WORK( ITAUQ ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of L in WORK(IR) and computing

*                    right singular vectors of L in WORK(IU)

*                    (Workspace: need 2*M*M + BDSPAC)

*

                     CALL DBDSQR( 'u', M, M, M, 0, S, WORK( IE ),

     $                            WORK( IU ), LDWRKU, WORK( IR ),

     $                            LDWRKR, DUM, 1, WORK( IWORK ), INFO )

*

*                    Multiply right singular vectors of L in WORK(IU) by

*                    Q in VT, storing result in A

*                    (Workspace: need M*M)

*

                     CALL DGEMM( 'n', 'n', M, N, M, ONE, WORK( IU ),

     $                           LDWRKU, VT, LDVT, ZERO, A, LDA )

*

*                    Copy right singular vectors of A from A to VT

*

                     CALL DLACPY( 'f', M, N, A, LDA, VT, LDVT )

*

*                    Copy left singular vectors of A from WORK(IR) to A

*

                     CALL DLACPY( 'f', M, M, WORK( IR ), LDWRKR, A,

     $                            LDA )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need M + N, prefer M + N*NB)

*

                     CALL DORGLQ( N, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Zero out above L in A

*

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, A( 1, 2 ),

     $                            LDA )

*

*                    Bidiagonalize L in A

*                    (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, A, LDA, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply right bidiagonalizing vectors in A by Q

*                    in VT

*                    (Workspace: need 3*M + N, prefer 3*M + N*NB)

*

                     CALL DORMBR( 'p', 'l', 't', M, N, M, A, LDA,

     $                            WORK( ITAUP ), VT, LDVT,

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in A

*                    (Workspace: need 4*M, prefer 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, A, LDA, WORK( ITAUQ ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in A and computing right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', M, N, M, 0, S, WORK( IE ), VT,

     $                            LDVT, A, LDA, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               ELSE IF( WNTUAS ) THEN

*

*                 Path 9t(N much larger than M, JOBU='S' or 'A',

*                         JOBVT='A')

*                 N right singular vectors to be computed in VT and

*                 M left singular vectors to be computed in U

*

.GE.                  IF( LWORKM*M+MAX( N + M, 4*M, BDSPAC ) ) THEN

*

*                    Sufficient workspace for a fast algorithm

*

                     IU = 1

.GE.                     IF( LWORKWRKBL+LDA*M ) THEN

*

*                       WORK(IU) is LDA by M

*

                        LDWRKU = LDA

                     ELSE

*

*                       WORK(IU) is M by M

*

                        LDWRKU = M

                     END IF

                     ITAU = IU + LDWRKU*M

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need M*M + 2*M, prefer M*M + M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need M*M + M + N, prefer M*M + M + N*NB)

*

                     CALL DORGLQ( N, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy L to WORK(IU), zeroing out above it

*

                     CALL DLACPY( 'l', M, M, A, LDA, WORK( IU ),

     $                            LDWRKU )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO,

     $                            WORK( IU+LDWRKU ), LDWRKU )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in WORK(IU), copying result to U

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, WORK( IU ), LDWRKU, S,

     $                            WORK( IE ), WORK( ITAUQ ),

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'l', M, M, WORK( IU ), LDWRKU, U,

     $                            LDU )

*

*                    Generate right bidiagonalizing vectors in WORK(IU)

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + (M-1)*NB)

*

                     CALL DORGBR( 'p', M, M, M, WORK( IU ), LDWRKU,

     $                            WORK( ITAUP ), WORK( IWORK ),

     $                            LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in U

*                    (Workspace: need M*M + 4*M, prefer M*M + 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, U, LDU, WORK( ITAUQ ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of L in U and computing right

*                    singular vectors of L in WORK(IU)

*                    (Workspace: need M*M + BDSPAC)

*

                     CALL DBDSQR( 'u', M, M, M, 0, S, WORK( IE ),

     $                            WORK( IU ), LDWRKU, U, LDU, DUM, 1,

     $                            WORK( IWORK ), INFO )

*

*                    Multiply right singular vectors of L in WORK(IU) by

*                    Q in VT, storing result in A

*                    (Workspace: need M*M)

*

                     CALL DGEMM( 'n', 'n', M, N, M, ONE, WORK( IU ),

     $                           LDWRKU, VT, LDVT, ZERO, A, LDA )

*

*                    Copy right singular vectors of A from A to VT

*

                     CALL DLACPY( 'f', M, N, A, LDA, VT, LDVT )

*

                  ELSE

*

*                    Insufficient workspace for a fast algorithm

*

                     ITAU = 1

                     IWORK = ITAU + M

*

*                    Compute A=L*Q, copying result to VT

*                    (Workspace: need 2*M, prefer M + M*NB)

*

                     CALL DGELQF( M, N, A, LDA, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

*

*                    Generate Q in VT

*                    (Workspace: need M + N, prefer M + N*NB)

*

                     CALL DORGLQ( N, N, M, VT, LDVT, WORK( ITAU ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Copy L to U, zeroing out above it

*

                     CALL DLACPY( 'l', M, M, A, LDA, U, LDU )

                     CALL DLASET( 'u', M-1, M-1, ZERO, ZERO, U( 1, 2 ),

     $                            LDU )

                     IE = ITAU

                     ITAUQ = IE + M

                     ITAUP = ITAUQ + M

                     IWORK = ITAUP + M

*

*                    Bidiagonalize L in U

*                    (Workspace: need 4*M, prefer 3*M + 2*M*NB)

*

                     CALL DGEBRD( M, M, U, LDU, S, WORK( IE ),

     $                            WORK( ITAUQ ), WORK( ITAUP ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Multiply right bidiagonalizing vectors in U by Q

*                    in VT

*                    (Workspace: need 3*M + N, prefer 3*M + N*NB)

*

                     CALL DORMBR( 'p', 'l', 't', M, N, M, U, LDU,

     $                            WORK( ITAUP ), VT, LDVT,

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

*

*                    Generate left bidiagonalizing vectors in U

*                    (Workspace: need 4*M, prefer 3*M + M*NB)

*

                     CALL DORGBR( 'q', M, M, M, U, LDU, WORK( ITAUQ ),

     $                            WORK( IWORK ), LWORK-IWORK+1, IERR )

                     IWORK = IE + M

*

*                    Perform bidiagonal QR iteration, computing left

*                    singular vectors of A in U and computing right

*                    singular vectors of A in VT

*                    (Workspace: need BDSPAC)

*

                     CALL DBDSQR( 'u', M, N, M, 0, S, WORK( IE ), VT,

     $                            LDVT, U, LDU, DUM, 1, WORK( IWORK ),

     $                            INFO )

*

                  END IF

*

               END IF

*

            END IF

*

         ELSE

*

*           N .LT. MNTHR

*

*           Path 10t(N greater than M, but not much larger)

*           Reduce to bidiagonal form without LQ decomposition

*

            IE = 1

            ITAUQ = IE + M

            ITAUP = ITAUQ + M

            IWORK = ITAUP + M

*

*           Bidiagonalize A

*           (Workspace: need 3*M + N, prefer 3*M + (M + N)*NB)

*

            CALL DGEBRD( M, N, A, LDA, S, WORK( IE ), WORK( ITAUQ ),

     $                   WORK( ITAUP ), WORK( IWORK ), LWORK-IWORK+1,

     $                   IERR )

            IF( WNTUAS ) THEN

*

*              If left singular vectors desired in U, copy result to U

*              and generate left bidiagonalizing vectors in U

*              (Workspace: need 4*M-1, prefer 3*M + (M-1)*NB)

*

               CALL DLACPY( 'l', M, M, A, LDA, U, LDU )

               CALL DORGBR( 'q', M, M, N, U, LDU, WORK( ITAUQ ),

     $                      WORK( IWORK ), LWORK-IWORK+1, IERR )

            END IF

            IF( WNTVAS ) THEN

*

*              If right singular vectors desired in VT, copy result to

*              VT and generate right bidiagonalizing vectors in VT

*              (Workspace: need 3*M + NRVT, prefer 3*M + NRVT*NB)

*

               CALL DLACPY( 'u', M, N, A, LDA, VT, LDVT )

               IF( WNTVA )

     $            NRVT = N

               IF( WNTVS )

     $            NRVT = M

               CALL DORGBR( 'p', NRVT, N, M, VT, LDVT, WORK( ITAUP ),

     $                      WORK( IWORK ), LWORK-IWORK+1, IERR )

            END IF

            IF( WNTUO ) THEN

*

*              If left singular vectors desired in A, generate left

*              bidiagonalizing vectors in A

*              (Workspace: need 4*M-1, prefer 3*M + (M-1)*NB)

*

               CALL DORGBR( 'q', M, M, N, A, LDA, WORK( ITAUQ ),

     $                      WORK( IWORK ), LWORK-IWORK+1, IERR )

            END IF

            IF( WNTVO ) THEN

*

*              If right singular vectors desired in A, generate right

*              bidiagonalizing vectors in A

*              (Workspace: need 4*M, prefer 3*M + M*NB)

*

               CALL DORGBR( 'p', M, N, M, A, LDA, WORK( ITAUP ),

     $                      WORK( IWORK ), LWORK-IWORK+1, IERR )

            END IF

            IWORK = IE + M

.OR.            IF( WNTUAS  WNTUO )

     $         NRU = M

            IF( WNTUN )

     $         NRU = 0

.OR.            IF( WNTVAS  WNTVO )

     $         NCVT = N

            IF( WNTVN )

     $         NCVT = 0

.NOT..AND..NOT.            IF( ( WNTUO )  ( WNTVO ) ) THEN

*

*              Perform bidiagonal QR iteration, if desired, computing

*              left singular vectors in U and computing right singular

*              vectors in VT

*              (Workspace: need BDSPAC)

*

               CALL DBDSQR( 'l', M, NCVT, NRU, 0, S, WORK( IE ), VT,

     $                      LDVT, U, LDU, DUM, 1, WORK( IWORK ), INFO )

.NOT..AND.            ELSE IF( ( WNTUO )  WNTVO ) THEN

*

*              Perform bidiagonal QR iteration, if desired, computing

*              left singular vectors in U and computing right singular

*              vectors in A

*              (Workspace: need BDSPAC)

*

               CALL DBDSQR( 'l', M, NCVT, NRU, 0, S, WORK( IE ), A, LDA,

     $                      U, LDU, DUM, 1, WORK( IWORK ), INFO )

            ELSE

*

*              Perform bidiagonal QR iteration, if desired, computing

*              left singular vectors in A and computing right singular

*              vectors in VT

*              (Workspace: need BDSPAC)

*

               CALL DBDSQR( 'l', M, NCVT, NRU, 0, S, WORK( IE ), VT,

     $                      LDVT, A, LDA, DUM, 1, WORK( IWORK ), INFO )

            END IF

*

         END IF

*

      END IF

*

*     If DBDSQR failed to converge, copy unconverged superdiagonals

*     to WORK( 2:MINMN )

*

.NE.      IF( INFO0 ) THEN

.GT.         IF( IE2 ) THEN

            DO 50 I = 1, MINMN - 1

               WORK( I+1 ) = WORK( I+IE-1 )

   50       CONTINUE

         END IF

.LT.         IF( IE2 ) THEN

            DO 60 I = MINMN - 1, 1, -1

               WORK( I+1 ) = WORK( I+IE-1 )

   60       CONTINUE

         END IF

      END IF

*

*     Undo scaling if necessary

*

.EQ.      IF( ISCL1 ) THEN

.GT.         IF( ANRMBIGNUM )

     $      CALL DLASCL( 'g', 0, 0, BIGNUM, ANRM, MINMN, 1, S, MINMN,

     $                   IERR )

.NE..AND..GT.         IF( INFO0  ANRMBIGNUM )

     $      CALL DLASCL( 'g', 0, 0, BIGNUM, ANRM, MINMN-1, 1, WORK( 2 ),

     $                   MINMN, IERR )

.LT.         IF( ANRMSMLNUM )

     $      CALL DLASCL( 'g', 0, 0, SMLNUM, ANRM, MINMN, 1, S, MINMN,

     $                   IERR )

.NE..AND..LT.         IF( INFO0  ANRMSMLNUM )

     $      CALL DLASCL( 'g', 0, 0, SMLNUM, ANRM, MINMN-1, 1, WORK( 2 ),

     $                   MINMN, IERR )

      END IF

*

*     Return optimal workspace in WORK(1)

*

      WORK( 1 ) = MAXWRK

*

      RETURN

*

*     End of DGESVD

*


      END

dlacpy
subroutine dlacpy(uplo, m, n, a, lda, b, ldb)
DLACPY copies all or part of one two-dimensional array to another.
Definition dlacpy.f:103

dlascl
subroutine dlascl(type, kl, ku, cfrom, cto, m, n, a, lda, info)
DLASCL multiplies a general rectangular matrix by a real scalar defined as cto/cfrom.
Definition dlascl.f:143

dlaset
subroutine dlaset(uplo, m, n, alpha, beta, a, lda)
DLASET initializes the off-diagonal elements and the diagonal elements of a matrix to given values.
Definition dlaset.f:110

dbdsqr
subroutine dbdsqr(uplo, n, ncvt, nru, ncc, d, e, vt, ldvt, u, ldu, c, ldc, work, info)
DBDSQR
Definition dbdsqr.f:241

xerbla
subroutine xerbla(srname, info)
XERBLA
Definition xerbla.f:60

dorgbr
subroutine dorgbr(vect, m, n, k, a, lda, tau, work, lwork, info)
DORGBR
Definition dorgbr.f:157

dgebrd
subroutine dgebrd(m, n, a, lda, d, e, tauq, taup, work, lwork, info)
DGEBRD
Definition dgebrd.f:205

dgelqf
subroutine dgelqf(m, n, a, lda, tau, work, lwork, info)
DGELQF
Definition dgelqf.f:143

dgeqrf
subroutine dgeqrf(m, n, a, lda, tau, work, lwork, info)
DGEQRF
Definition dgeqrf.f:146

dgesvd
subroutine dgesvd(jobu, jobvt, m, n, a, lda, s, u, ldu, vt, ldvt, work, lwork, info)
DGESVD computes the singular value decomposition (SVD) for GE matrices
Definition dgesvd.f:211

dormbr
subroutine dormbr(vect, side, trans, m, n, k, a, lda, tau, c, ldc, work, lwork, info)
DORMBR
Definition dormbr.f:195

dorgqr
subroutine dorgqr(m, n, k, a, lda, tau, work, lwork, info)
DORGQR
Definition dorgqr.f:128

dorglq
subroutine dorglq(m, n, k, a, lda, tau, work, lwork, info)
DORGLQ
Definition dorglq.f:127

dgemm
subroutine dgemm(transa, transb, m, n, k, alpha, a, lda, b, ldb, beta, c, ldc)
DGEMM
Definition dgemm.f:187

min
#define min(a, b)
Definition macros.h:20

max
#define max(a, b)
Definition macros.h:21