0f8c223c7aa5b2e55c8619fba8be93fff679abb4
[pspp-builds.git] / lib / linreg / sweep.c
1 /* PSPP - a program for statistical analysis.
2    Copyright (C) 2005, 2009 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>. */
16
17 /*
18   Find the least-squares estimate of b for the linear model:
19
20   Y = Xb + Z
21
22   where Y is an n-by-1 column vector, X is an n-by-p matrix of
23   independent variables, b is a p-by-1 vector of regression coefficients,
24   and Z is an n-by-1 normally-distributed random vector with independent
25   identically distributed components with mean 0.
26
27   This estimate is found via the sweep operator, which is a modification
28   of Gauss-Jordan pivoting.
29
30
31   References:
32
33   Matrix Computations, third edition. GH Golub and CF Van Loan.
34   The Johns Hopkins University Press. 1996. ISBN 0-8018-5414-8.
35
36   Numerical Analysis for Statisticians. K Lange. Springer. 1999.
37   ISBN 0-387-94979-8.
38
39   Numerical Linear Algebra for Applications in Statistics. JE Gentle.
40   Springer. 1998. ISBN 0-387-98542-5.
41 */
42
43 #include <config.h>
44
45 #include "sweep.h"
46
47 #include <assert.h>
48 /*
49   The matrix A will be overwritten. In ordinary uses of the sweep
50   operator, A will be the matrix
51
52   __       __
53   |X'X    X'Y|
54   |          |
55   |Y'X    Y'Y|
56   --        --
57
58   X refers to the design matrix and Y to the vector of dependent
59   observations. reg_sweep sweeps on the diagonal elements of
60   X'X.
61
62   The matrix A is assumed to be symmetric, so the sweep operation is
63   performed only for the upper triangle of A.
64
65   LAST_COL is considered to be the final column in the augmented matrix,
66   that is, the column to the right of the '=' sign of the system.
67 */
68
69 int
70 reg_sweep (gsl_matrix * A, int last_col)
71 {
72   if (A == NULL)
73     return GSL_EFAULT;
74
75   if (A->size1 != A->size2)
76     return GSL_ENOTSQR;
77
78   double sweep_element;
79   double tmp;
80   int i;
81   int j;
82   int k;
83   gsl_matrix *B;
84
85
86   assert (last_col < A->size1);
87   gsl_matrix_swap_rows (A, A->size1 - 1, last_col);
88   gsl_matrix_swap_columns (A, A->size1 - 1 , last_col);
89           
90   B = gsl_matrix_alloc (A->size1, A->size2);
91   for (k = 0; k < (A->size1 - 1); k++)
92     {
93       sweep_element = gsl_matrix_get (A, k, k);
94       if (fabs (sweep_element) > GSL_DBL_MIN)
95         {
96           tmp = -1.0 / sweep_element;
97           gsl_matrix_set (B, k, k, tmp);
98           /*
99             Rows before current row k.
100           */
101           for (i = 0; i < k; i++)
102             {
103               for (j = i; j < A->size2; j++)
104                 {
105                   /*
106                     Use only the upper triangle of A.
107                   */
108                   if (j < k)
109                     {
110                       tmp = gsl_matrix_get (A, i, j) -
111                         gsl_matrix_get (A, i, k)
112                         * gsl_matrix_get (A, j, k) / sweep_element;
113                       gsl_matrix_set (B, i, j, tmp);
114                     }
115                   else if (j > k)
116                     {
117                       tmp = gsl_matrix_get (A, i, j) -
118                         gsl_matrix_get (A, i, k)
119                         * gsl_matrix_get (A, k, j) / sweep_element;
120                       gsl_matrix_set (B, i, j, tmp);
121                     }
122                   else
123                     {
124                       tmp = gsl_matrix_get (A, i, k) / sweep_element;
125                       gsl_matrix_set (B, i, j, tmp);
126                     }
127                 }
128             }
129           /*
130             Current row k.
131           */
132           for (j = k + 1; j < A->size1; j++)
133             {
134               tmp = gsl_matrix_get (A, k, j) / sweep_element;
135               gsl_matrix_set (B, k, j, tmp);
136             }
137           /*
138             Rows after the current row k.
139           */
140           for (i = k + 1; i < A->size1; i++)
141             {
142               for (j = i; j < A->size2; j++)
143                 {
144                   tmp = gsl_matrix_get (A, i, j) -
145                     gsl_matrix_get (A, k, i)
146                     * gsl_matrix_get (A, k, j) / sweep_element;
147                   gsl_matrix_set (B, i, j, tmp);
148                 }
149             }
150         }
151       for (i = 0; i < A->size1; i++)
152         for (j = i; j < A->size2; j++)
153           {
154             gsl_matrix_set (A, i, j, gsl_matrix_get (B, i, j));
155           }
156     }
157   gsl_matrix_free (B);
158
159   gsl_matrix_swap_columns (A, A->size1 - 1 , last_col);
160   gsl_matrix_swap_rows (A, A->size1 - 1, last_col);
161
162   return GSL_SUCCESS;
163 }