libflame  revision_anchor
Functions | Variables
bl1_axmyv2.c File Reference

(r)

Functions

void bl1_saxmyv2 (conj1_t conjx, int n, float *alpha, float *beta, float *x, int inc_x, float *y, int inc_y, float *z, int inc_z)
 
void bl1_daxmyv2 (conj1_t conjx, int n, double *alpha, double *beta, double *x, int inc_x, double *y, int inc_y, double *z, int inc_z)
 
 if (inc_x !=1||inc_y !=1||inc_z !=1)
 
 for (i=0;i< n_run;++i)
 
 if (n_left > 0)
 
void bl1_caxmyv2 (conj1_t conjx, int n, scomplex *alpha, scomplex *beta, scomplex *x, int inc_x, scomplex *y, int inc_y, scomplex *z, int inc_z)
 
void bl1_zaxmyv2 (conj1_t conjx, int n, dcomplex *alpha, dcomplex *beta, dcomplex *x, int inc_x, dcomplex *y, int inc_y, dcomplex *z, int inc_z)
 
 if (bl1_is_conj(conjx))
 

Variables

double *restrict psi1
 
double *restrict zeta1 = z
 
double alpha_c = *alpha
 
double beta_c = *beta
 
int i
 
int n_pre
 
int n_run
 
int n_left
 
 chi1 = x
 

Function Documentation

◆ bl1_caxmyv2()

void bl1_caxmyv2 ( conj1_t  conjx,
int  n,
scomplex alpha,
scomplex beta,
scomplex x,
int  inc_x,
scomplex y,
int  inc_y,
scomplex z,
int  inc_z 
)
245 {
246  bl1_abort();
247 }
void bl1_abort(void)
Definition: bl1_abort.c:13

References bl1_abort().

◆ bl1_daxmyv2()

void bl1_daxmyv2 ( conj1_t  conjx,
int  n,
double *  alpha,
double *  beta,
double *  x,
int  inc_x,
double *  y,
int  inc_y,
double *  z,
int  inc_z 
)
42 {
43  double* restrict chi1;
44  double* restrict psi1;
45  double* restrict zeta1;
46  int i;
47 
48  int n_pre;
49  int n_run;
50  int n_left;
51 
52  v2df_t a1v, b1v;
53  v2df_t x1v, y1v, z1v;
54  v2df_t x2v, y2v, z2v;
55 
56  if ( inc_x != 1 ||
57  inc_y != 1 ||
58  inc_z != 1 ) bl1_abort();
59 
60  n_pre = 0;
61  if ( ( unsigned long ) z % 16 != 0 )
62  {
63  if ( ( unsigned long ) x % 16 == 0 ||
64  ( unsigned long ) y % 16 == 0 ) bl1_abort();
65 
66  n_pre = 1;
67  }
68 
69  n_run = ( n - n_pre ) / 4;
70  n_left = ( n - n_pre ) % 4;
71 
72  chi1 = x;
73  psi1 = y;
74  zeta1 = z;
75 
76  if ( n_pre == 1 )
77  {
78  double alpha_c = *alpha;
79  double beta_c = *beta;
80  double chi1_c = *chi1;
81 
82  *psi1 -= alpha_c * chi1_c;
83  *zeta1 -= beta_c * chi1_c;
84 
85  chi1 += inc_x;
86  psi1 += inc_y;
87  zeta1 += inc_z;
88  }
89 
90  a1v.v = _mm_loaddup_pd( ( double* )alpha );
91  b1v.v = _mm_loaddup_pd( ( double* )beta );
92 
93  for ( i = 0; i < n_run; ++i )
94  {
95  x1v.v = _mm_load_pd( ( double* )chi1 );
96  y1v.v = _mm_load_pd( ( double* )psi1 );
97  z1v.v = _mm_load_pd( ( double* )zeta1 );
98 
99  x2v.v = _mm_load_pd( ( double* )(chi1 + 2) );
100  y2v.v = _mm_load_pd( ( double* )(psi1 + 2) );
101  z2v.v = _mm_load_pd( ( double* )(zeta1 + 2) );
102 
103  y1v.v = y1v.v - a1v.v * x1v.v;
104  z1v.v = z1v.v - b1v.v * x1v.v;
105 
106  _mm_store_pd( ( double* )psi1, y1v.v );
107  _mm_store_pd( ( double* )zeta1, z1v.v );
108 
109  y2v.v = y2v.v - a1v.v * x2v.v;
110  z2v.v = z2v.v - b1v.v * x2v.v;
111 
112  _mm_store_pd( ( double* )(psi1 + 2), y2v.v );
113  _mm_store_pd( ( double* )(zeta1 + 2), z2v.v );
114 
115  chi1 += 4;
116  psi1 += 4;
117  zeta1 += 4;
118  }
119 
120  if ( n_left > 0 )
121  {
122  double alpha_c = *alpha;
123  double beta_c = *beta;
124 
125  for( i = 0; i < n_left; ++i )
126  {
127  double chi1_c = *chi1;
128 
129  *psi1 -= alpha_c * chi1_c;
130  *zeta1 -= beta_c * chi1_c;
131 
132  chi1 += inc_x;
133  psi1 += inc_y;
134  zeta1 += inc_z;
135  }
136  }
137 }
double *restrict zeta1
Definition: bl1_axmyv2.c:142
double *restrict psi1
Definition: bl1_axmyv2.c:139
double beta_c
Definition: bl1_axmyv2.c:144
double alpha_c
Definition: bl1_axmyv2.c:143
int n_left
Definition: bl1_axmyv2.c:149
int n_pre
Definition: bl1_axmyv2.c:147
int n_run
Definition: bl1_axmyv2.c:148
int i
Definition: bl1_axmyv2.c:145
chi1
Definition: bl1_axmyv2.c:366
Definition: blis_type_defs.h:117
__m128d v
Definition: blis_type_defs.h:118

References alpha_c, beta_c, bl1_abort(), chi1, i, n_left, n_pre, n_run, psi1, v2df_t::v, and zeta1.

Referenced by FLA_Fused_UYx_ZVx_opd_var1().

◆ bl1_saxmyv2()

void bl1_saxmyv2 ( conj1_t  conjx,
int  n,
float *  alpha,
float *  beta,
float *  x,
int  inc_x,
float *  y,
int  inc_y,
float *  z,
int  inc_z 
)
29 {
30  bl1_abort();
31 }

References bl1_abort().

◆ bl1_zaxmyv2()

void bl1_zaxmyv2 ( conj1_t  conjx,
int  n,
dcomplex alpha,
dcomplex beta,
dcomplex x,
int  inc_x,
dcomplex y,
int  inc_y,
dcomplex z,
int  inc_z 
)
258 {
259  dcomplex* restrict chi1;
260  dcomplex* restrict psi1;
261  dcomplex* restrict zeta1;
264  int i;
265  v2df_t alphav, alpharv;
266  v2df_t betav, betarv;
267  v2df_t x11v, x12v, y1v, z1v;
268  v2df_t acbc, bdad;
269 
270  chi1 = x;
271  psi1 = y;
272  zeta1 = z;
273 
274  alphav.v = _mm_load_pd( ( double* )alpha );
275  betav.v = _mm_load_pd( ( double* )beta );
276  alpharv.v = _mm_shuffle_pd( alphav.v, alphav.v, _MM_SHUFFLE2 (0,1) );
277  betarv.v = _mm_shuffle_pd( betav.v, betav.v, _MM_SHUFFLE2 (0,1) );
278 
279  if ( bl1_is_conj( conjx ) )
280  {
281  alpha_c = *alpha;
282  beta_c = *beta;
283 
284  for ( i = 0; i < n; ++i )
285  {
286  dcomplex chi1_c = *chi1;
287 
288  // psi1 = psi1 + alpha * chi1;
289  psi1->real += alpha_c.real * chi1_c.real - alpha_c.imag * -chi1_c.imag;
290  psi1->imag += alpha_c.real * -chi1_c.imag + alpha_c.imag * chi1_c.real;
291 
292  // zeta1 = zeta1 + beta * chi1;
293  zeta1->real += beta_c.real * chi1_c.real - beta_c.imag * -chi1_c.imag;
294  zeta1->imag += beta_c.real * -chi1_c.imag + beta_c.imag * chi1_c.real;
295 
296  chi1 += inc_x;
297  psi1 += inc_y;
298  zeta1 += inc_z;
299  }
300  }
301  else
302  {
303  if ( inc_x == 1 &&
304  inc_y == 1 &&
305  inc_z == 1 )
306  {
307  for ( i = 0; i < n; ++i )
308  {
309  x11v.v = _mm_load_pd( ( double* )chi1 );
310  x12v.v = _mm_shuffle_pd( x11v.v, x11v.v, _MM_SHUFFLE2 (1,1) );
311  x11v.v = _mm_shuffle_pd( x11v.v, x11v.v, _MM_SHUFFLE2 (0,0) );
312 
313  acbc.v = alphav.v * x11v.v;
314  bdad.v = alpharv.v * x12v.v;
315  y1v.v = _mm_load_pd( ( double* )psi1 );
316  y1v.v = y1v.v - _mm_addsub_pd( acbc.v, bdad.v );
317  _mm_store_pd( ( double* )psi1, y1v.v );
318 
319  acbc.v = betav.v * x11v.v;
320  bdad.v = betarv.v * x12v.v;
321  z1v.v = _mm_load_pd( ( double* )zeta1 );
322  z1v.v = z1v.v - _mm_addsub_pd( acbc.v, bdad.v );
323  _mm_store_pd( ( double* )zeta1, z1v.v );
324 
325  chi1 += 1;
326  psi1 += 1;
327  zeta1 += 1;
328  }
329  }
330  else
331  {
332  for ( i = 0; i < n; ++i )
333  {
334  x11v.v = _mm_load_pd( ( double* )chi1 );
335  x12v.v = _mm_shuffle_pd( x11v.v, x11v.v, _MM_SHUFFLE2 (1,1) );
336  x11v.v = _mm_shuffle_pd( x11v.v, x11v.v, _MM_SHUFFLE2 (0,0) );
337 
338  acbc.v = alphav.v * x11v.v;
339  bdad.v = alpharv.v * x12v.v;
340  y1v.v = _mm_load_pd( ( double* )psi1 );
341  y1v.v = y1v.v - _mm_addsub_pd( acbc.v, bdad.v );
342  _mm_store_pd( ( double* )psi1, y1v.v );
343 
344  acbc.v = betav.v * x11v.v;
345  bdad.v = betarv.v * x12v.v;
346  z1v.v = _mm_load_pd( ( double* )zeta1 );
347  z1v.v = z1v.v - _mm_addsub_pd( acbc.v, bdad.v );
348  _mm_store_pd( ( double* )zeta1, z1v.v );
349 
350  chi1 += inc_x;
351  psi1 += inc_y;
352  zeta1 += inc_z;
353  }
354  }
355  }
356 }
int bl1_is_conj(conj1_t conj)
Definition: bl1_is.c:42
Definition: blis_type_defs.h:138
double real
Definition: blis_type_defs.h:139
double imag
Definition: blis_type_defs.h:139

References alpha_c, beta_c, bl1_is_conj(), chi1, i, dcomplex::imag, psi1, dcomplex::real, v2df_t::v, and zeta1.

Referenced by FLA_Fused_UYx_ZVx_opz_var1().

◆ for()

for ( )
189  {
190  double chi1_c = *chi1;
191  double chi2_c = *(chi1 + 1);
192  double psi1_c = *psi1;
193  double psi2_c = *(psi1 + 1);
194  double zeta1_c = *zeta1;
195  double zeta2_c = *(zeta1 + 1);
196 
197  // psi1 = psi1 - alpha * chi1;
198  // psi2 = psi2 - alpha * chi2;
199  psi1_c -= alpha_c * chi1_c;
200  psi2_c -= alpha_c * chi2_c;
201 
202  // zeta1 = zeta1 - beta * chi1;
203  // zeta2 = zeta2 - beta * chi2;
204  zeta1_c -= beta_c * chi1_c;
205  zeta2_c -= beta_c * chi2_c;
206 
207  *psi1 = psi1_c;
208  *(psi1 + 1) = psi2_c;
209  *zeta1 = zeta1_c;
210  *(zeta1 + 1) = zeta2_c;
211 
212  chi1 += 2*inc_x;
213  psi1 += 2*inc_y;
214  zeta1 += 2*inc_z;
215  }

References alpha_c, beta_c, chi1, psi1, and zeta1.

Referenced by FLASH_Queue_exec().

◆ if() [1/3]

if ( bl1_is_conj(conjx)  )
374  {
375  for ( i = 0; i < n; ++i )
376  {
377  dcomplex chi1_c = *chi1;
378 
379  // psi1 = psi1 - alpha * chi1;
380  psi1->real -= alpha_c.real * chi1_c.real - alpha_c.imag * -chi1_c.imag;
381  psi1->imag -= alpha_c.real * -chi1_c.imag + alpha_c.imag * chi1_c.real;
382 
383  // zeta1 = zeta1 - beta * chi1;
384  zeta1->real -= beta_c.real * chi1_c.real - beta_c.imag * -chi1_c.imag;
385  zeta1->imag -= beta_c.real * -chi1_c.imag + beta_c.imag * chi1_c.real;
386 
387  chi1 += inc_x;
388  psi1 += inc_y;
389  zeta1 += inc_z;
390  }
391  }

References alpha_c, beta_c, chi1, i, dcomplex::imag, psi1, dcomplex::real, and zeta1.

◆ if() [2/3]

if ( inc_x !  = 1 || inc_y != 1 || inc_z != 1)
175  {
176  //double alpha_c = *alpha;
177  //double beta_c = *beta;
178  double chi1_c = *chi1;
179 
180  *psi1 -= alpha_c * chi1_c;
181  *zeta1 -= beta_c * chi1_c;
182 
183  chi1 += inc_x;
184  psi1 += inc_y;
185  zeta1 += inc_z;
186  }

◆ if() [3/3]

if ( n_left  ,
 
)
218  {
219  //double alpha_c = *alpha;
220  //double beta_c = *beta;
221 
222  for( i = 0; i < n_left; ++i )
223  {
224  double chi1_c = *chi1;
225 
226  *psi1 -= alpha_c * chi1_c;
227  *zeta1 -= beta_c * chi1_c;
228 
229  chi1 += inc_x;
230  psi1 += inc_y;
231  zeta1 += inc_z;
232  }
233  }

References alpha_c, beta_c, chi1, i, n_left, psi1, and zeta1.

Variable Documentation

◆ alpha_c

dcomplex alpha_c = *alpha

Referenced by bl1_daxmyv2(), bl1_zaxmyv2(), for(), and if().

◆ beta_c

dcomplex beta_c = *beta

Referenced by bl1_daxmyv2(), bl1_zaxmyv2(), for(), and if().

◆ chi1

dcomplex *restrict chi1 = x

◆ i

int i

Referenced by bl1_cdcopyv(), bl1_cdot_in(), bl1_cewinvscalv(), bl1_cewscalv(), bl1_cfnorm(), bl1_cident(), bl1_cinvertv(), bl1_cmaxabsv(), bl1_crandv(), bl1_cscalediag(), bl1_cscopyv(), bl1_csetdiag(), bl1_csetm(), bl1_csetv(), bl1_csewinvscalv(), bl1_csewscalv(), bl1_cshiftdiag(), bl1_csscalediag(), bl1_csshiftdiag(), bl1_czcopyv(), bl1_daxmyv2(), bl1_dccopyv(), bl1_dewinvscalv(), bl1_dewscalv(), bl1_dfnorm(), bl1_dident(), bl1_dinvertv(), bl1_dmaxabsv(), bl1_drandv(), bl1_dscalediag(), bl1_dscopyv(), bl1_dsetdiag(), bl1_dsetm(), bl1_dsetv(), bl1_dshiftdiag(), bl1_dzcopyv(), bl1_icopyv(), bl1_isetdiag(), bl1_isetm(), bl1_isetv(), bl1_sccopyv(), bl1_sdcopyv(), bl1_sewinvscalv(), bl1_sewscalv(), bl1_sfnorm(), bl1_sident(), bl1_sinvertv(), bl1_smaxabsv(), bl1_srandv(), bl1_sscalediag(), bl1_ssetdiag(), bl1_ssetm(), bl1_ssetv(), bl1_sshiftdiag(), bl1_szcopyv(), bl1_zaxmyv2(), bl1_zccopyv(), bl1_zdcopyv(), bl1_zdewinvscalv(), bl1_zdewscalv(), bl1_zdot_in(), bl1_zdscalediag(), bl1_zdshiftdiag(), bl1_zewinvscalv(), bl1_zewscalv(), bl1_zfnorm(), bl1_zident(), bl1_zinvertv(), bl1_zmaxabsv(), bl1_zrandv(), bl1_zscalediag(), bl1_zscopyv(), bl1_zsetdiag(), bl1_zsetm(), bl1_zsetv(), bl1_zshiftdiag(), FLA_Accum_T_UT_fc_opc_var1(), FLA_Accum_T_UT_fc_opd_var1(), FLA_Accum_T_UT_fc_ops_var1(), FLA_Accum_T_UT_fc_opz_var1(), FLA_Accum_T_UT_fr_opc_var1(), FLA_Accum_T_UT_fr_opd_var1(), FLA_Accum_T_UT_fr_ops_var1(), FLA_Accum_T_UT_fr_opz_var1(), FLA_Apply_G_rf_asc_var3(), FLA_Apply_G_rf_asc_var6(), FLA_Apply_G_rf_asc_var9(), FLA_Apply_G_rf_asd_var3(), FLA_Apply_G_rf_asd_var3b(), FLA_Apply_G_rf_asd_var6(), FLA_Apply_G_rf_asd_var6b(), FLA_Apply_G_rf_asd_var9(), FLA_Apply_G_rf_asd_var9b(), FLA_Apply_G_rf_ass_var3(), FLA_Apply_G_rf_ass_var6(), FLA_Apply_G_rf_ass_var9(), FLA_Apply_G_rf_asz_var3(), FLA_Apply_G_rf_asz_var6(), FLA_Apply_G_rf_asz_var9(), FLA_Apply_G_rf_blc_var1(), FLA_Apply_G_rf_blc_var2(), FLA_Apply_G_rf_blc_var3(), FLA_Apply_G_rf_blc_var6(), FLA_Apply_G_rf_blc_var9(), FLA_Apply_G_rf_bld_var1(), FLA_Apply_G_rf_bld_var2(), FLA_Apply_G_rf_bld_var3(), FLA_Apply_G_rf_bld_var3b(), FLA_Apply_G_rf_bld_var6(), FLA_Apply_G_rf_bld_var6b(), FLA_Apply_G_rf_bld_var9(), FLA_Apply_G_rf_bld_var9b(), FLA_Apply_G_rf_bls_var1(), FLA_Apply_G_rf_bls_var2(), FLA_Apply_G_rf_bls_var3(), FLA_Apply_G_rf_bls_var3b(), FLA_Apply_G_rf_bls_var6(), FLA_Apply_G_rf_bls_var6b(), FLA_Apply_G_rf_bls_var9(), FLA_Apply_G_rf_bls_var9b(), FLA_Apply_G_rf_blz_var1(), FLA_Apply_G_rf_blz_var2(), FLA_Apply_G_rf_blz_var3(), FLA_Apply_G_rf_blz_var6(), FLA_Apply_G_rf_blz_var9(), FLA_Apply_G_rf_opc_var3(), FLA_Apply_G_rf_opc_var6(), FLA_Apply_G_rf_opc_var9(), FLA_Apply_G_rf_opd_var3(), FLA_Apply_G_rf_opd_var6(), FLA_Apply_G_rf_opd_var9(), FLA_Apply_G_rf_ops_var3(), FLA_Apply_G_rf_ops_var6(), FLA_Apply_G_rf_ops_var9(), FLA_Apply_G_rf_opz_var3(), FLA_Apply_G_rf_opz_var6(), FLA_Apply_G_rf_opz_var9(), FLA_Apply_pivots_ln_opc_var1(), FLA_Apply_pivots_ln_opd_var1(), FLA_Apply_pivots_ln_opi_var1(), FLA_Apply_pivots_ln_ops_var1(), FLA_Apply_pivots_ln_opz_var1(), FLA_Apply_pivots_macro_external(), FLA_Apply_pivots_unb_external(), FLA_Axpy_buffer_to_object(), FLA_Axpy_buffer_to_object_check(), FLA_Axpy_external_gpu(), FLA_Axpy_object_to_buffer(), FLA_Axpy_object_to_buffer_check(), FLA_Bidiag_apply_U_external(), FLA_Bidiag_apply_V_external(), FLA_Bidiag_form_U_external(), FLA_Bidiag_form_V_external(), FLA_Bidiag_UT_l_extract_diagonals(), FLA_Bidiag_UT_l_extract_real_diagonals(), FLA_Bidiag_UT_l_realify_opt(), FLA_Bidiag_UT_l_scale_diagonals(), FLA_Bidiag_UT_realify_diagonals_opt(), FLA_Bidiag_UT_u_extract_diagonals(), FLA_Bidiag_UT_u_extract_real_diagonals(), FLA_Bidiag_UT_u_realify_opt(), FLA_Bidiag_UT_u_scale_diagonals(), FLA_Bidiag_UT_u_step_ofc_var2(), FLA_Bidiag_UT_u_step_ofc_var3(), FLA_Bidiag_UT_u_step_ofc_var4(), FLA_Bidiag_UT_u_step_ofd_var2(), FLA_Bidiag_UT_u_step_ofd_var3(), FLA_Bidiag_UT_u_step_ofd_var4(), FLA_Bidiag_UT_u_step_ofs_var2(), FLA_Bidiag_UT_u_step_ofs_var3(), FLA_Bidiag_UT_u_step_ofs_var4(), FLA_Bidiag_UT_u_step_ofz_var2(), FLA_Bidiag_UT_u_step_ofz_var3(), FLA_Bidiag_UT_u_step_ofz_var4(), FLA_Bidiag_UT_u_step_opc_var1(), FLA_Bidiag_UT_u_step_opc_var2(), FLA_Bidiag_UT_u_step_opc_var3(), FLA_Bidiag_UT_u_step_opc_var4(), FLA_Bidiag_UT_u_step_opc_var5(), FLA_Bidiag_UT_u_step_opd_var1(), FLA_Bidiag_UT_u_step_opd_var2(), FLA_Bidiag_UT_u_step_opd_var3(), FLA_Bidiag_UT_u_step_opd_var4(), FLA_Bidiag_UT_u_step_opd_var5(), FLA_Bidiag_UT_u_step_ops_var1(), FLA_Bidiag_UT_u_step_ops_var2(), FLA_Bidiag_UT_u_step_ops_var3(), FLA_Bidiag_UT_u_step_ops_var4(), FLA_Bidiag_UT_u_step_ops_var5(), FLA_Bidiag_UT_u_step_opz_var1(), FLA_Bidiag_UT_u_step_opz_var2(), FLA_Bidiag_UT_u_step_opz_var3(), FLA_Bidiag_UT_u_step_opz_var4(), FLA_Bidiag_UT_u_step_opz_var5(), FLA_Bsvd_compute_tol_thresh_opd(), FLA_Bsvd_compute_tol_thresh_ops(), FLA_Bsvd_ext_opc_var1(), FLA_Bsvd_ext_opd_var1(), FLA_Bsvd_ext_ops_var1(), FLA_Bsvd_ext_opz_var1(), FLA_Bsvd_find_converged_opd(), FLA_Bsvd_find_converged_ops(), FLA_Bsvd_find_max_min_opd(), FLA_Bsvd_find_max_min_ops(), FLA_Bsvd_francis_v_opd_var1(), FLA_Bsvd_francis_v_ops_var1(), FLA_Bsvd_iteracc_v_opd_var1(), FLA_Bsvd_iteracc_v_ops_var1(), FLA_Bsvd_v_opc_var1(), FLA_Bsvd_v_opd_var1(), FLA_Bsvd_v_opd_var2(), FLA_Bsvd_v_ops_var1(), FLA_Bsvd_v_opz_var1(), FLA_Bsvd_v_opz_var2(), FLA_CAQR2_UT_opc_var1(), FLA_CAQR2_UT_opd_var1(), FLA_CAQR2_UT_ops_var1(), FLA_CAQR2_UT_opz_var1(), FLA_CAQR_UT_inc_init_structure(), FLA_Check_submatrix_dims_and_offset(), FLA_Chol_l_opc_var1(), FLA_Chol_l_opc_var2(), FLA_Chol_l_opc_var3(), FLA_Chol_l_opd_var1(), FLA_Chol_l_opd_var2(), FLA_Chol_l_opd_var3(), FLA_Chol_l_ops_var1(), FLA_Chol_l_ops_var2(), FLA_Chol_l_ops_var3(), FLA_Chol_l_opz_var1(), FLA_Chol_l_opz_var2(), FLA_Chol_l_opz_var3(), FLA_Chol_u_opc_var1(), FLA_Chol_u_opc_var2(), FLA_Chol_u_opc_var3(), FLA_Chol_u_opd_var1(), FLA_Chol_u_opd_var2(), FLA_Chol_u_opd_var3(), FLA_Chol_u_ops_var1(), FLA_Chol_u_ops_var2(), FLA_Chol_u_ops_var3(), FLA_Chol_u_opz_var1(), FLA_Chol_u_opz_var2(), FLA_Chol_u_opz_var3(), FLA_Copy_buffer_to_object(), FLA_Copy_buffer_to_object_check(), FLA_Copy_external_gpu(), FLA_Copy_object_to_buffer(), FLA_Copy_object_to_buffer_check(), FLA_Eig_gest_il_opc_var1(), FLA_Eig_gest_il_opc_var2(), FLA_Eig_gest_il_opc_var3(), FLA_Eig_gest_il_opc_var4(), FLA_Eig_gest_il_opc_var5(), FLA_Eig_gest_il_opd_var1(), FLA_Eig_gest_il_opd_var2(), FLA_Eig_gest_il_opd_var3(), FLA_Eig_gest_il_opd_var4(), FLA_Eig_gest_il_opd_var5(), FLA_Eig_gest_il_ops_var1(), FLA_Eig_gest_il_ops_var2(), FLA_Eig_gest_il_ops_var3(), FLA_Eig_gest_il_ops_var4(), FLA_Eig_gest_il_ops_var5(), FLA_Eig_gest_il_opz_var1(), FLA_Eig_gest_il_opz_var2(), FLA_Eig_gest_il_opz_var3(), FLA_Eig_gest_il_opz_var4(), FLA_Eig_gest_il_opz_var5(), FLA_Eig_gest_iu_opc_var1(), FLA_Eig_gest_iu_opc_var2(), FLA_Eig_gest_iu_opc_var3(), FLA_Eig_gest_iu_opc_var4(), FLA_Eig_gest_iu_opc_var5(), FLA_Eig_gest_iu_opd_var1(), FLA_Eig_gest_iu_opd_var2(), FLA_Eig_gest_iu_opd_var3(), FLA_Eig_gest_iu_opd_var4(), FLA_Eig_gest_iu_opd_var5(), FLA_Eig_gest_iu_ops_var1(), FLA_Eig_gest_iu_ops_var2(), FLA_Eig_gest_iu_ops_var3(), FLA_Eig_gest_iu_ops_var4(), FLA_Eig_gest_iu_ops_var5(), FLA_Eig_gest_iu_opz_var1(), FLA_Eig_gest_iu_opz_var2(), FLA_Eig_gest_iu_opz_var3(), FLA_Eig_gest_iu_opz_var4(), FLA_Eig_gest_iu_opz_var5(), FLA_Eig_gest_nl_opc_var1(), FLA_Eig_gest_nl_opc_var2(), FLA_Eig_gest_nl_opc_var4(), FLA_Eig_gest_nl_opc_var5(), FLA_Eig_gest_nl_opd_var1(), FLA_Eig_gest_nl_opd_var2(), FLA_Eig_gest_nl_opd_var4(), FLA_Eig_gest_nl_opd_var5(), FLA_Eig_gest_nl_ops_var1(), FLA_Eig_gest_nl_ops_var2(), FLA_Eig_gest_nl_ops_var4(), FLA_Eig_gest_nl_ops_var5(), FLA_Eig_gest_nl_opz_var1(), FLA_Eig_gest_nl_opz_var2(), FLA_Eig_gest_nl_opz_var4(), FLA_Eig_gest_nl_opz_var5(), FLA_Eig_gest_nu_opc_var1(), FLA_Eig_gest_nu_opc_var2(), FLA_Eig_gest_nu_opc_var4(), FLA_Eig_gest_nu_opc_var5(), FLA_Eig_gest_nu_opd_var1(), FLA_Eig_gest_nu_opd_var2(), FLA_Eig_gest_nu_opd_var4(), FLA_Eig_gest_nu_opd_var5(), FLA_Eig_gest_nu_ops_var1(), FLA_Eig_gest_nu_ops_var2(), FLA_Eig_gest_nu_ops_var4(), FLA_Eig_gest_nu_ops_var5(), FLA_Eig_gest_nu_opz_var1(), FLA_Eig_gest_nu_opz_var2(), FLA_Eig_gest_nu_opz_var4(), FLA_Eig_gest_nu_opz_var5(), FLA_Fused_Ahx_Ax_opc_var1(), FLA_Fused_Ahx_Ax_opd_var1(), FLA_Fused_Ahx_Ax_ops_var1(), FLA_Fused_Ahx_Ax_opz_var1(), FLA_Fused_Ahx_Axpy_Ax_opc_var1(), FLA_Fused_Ahx_Axpy_Ax_opd_var1(), FLA_Fused_Ahx_Axpy_Ax_ops_var1(), FLA_Fused_Ahx_Axpy_Ax_opz_var1(), FLA_Fused_Gerc2_Ahx_Ax_opc_var1(), FLA_Fused_Gerc2_Ahx_Ax_opd_var1(), FLA_Fused_Gerc2_Ahx_Ax_ops_var1(), FLA_Fused_Gerc2_Ahx_Ax_opz_var1(), FLA_Fused_Gerc2_Ahx_Axpy_Ax_opc_var1(), FLA_Fused_Gerc2_Ahx_Axpy_Ax_opd_var1(), FLA_Fused_Gerc2_Ahx_Axpy_Ax_ops_var1(), FLA_Fused_Gerc2_Ahx_Axpy_Ax_opz_var1(), FLA_Fused_Gerc2_opc_var1(), FLA_Fused_Gerc2_opd_var1(), FLA_Fused_Gerc2_ops_var1(), FLA_Fused_Gerc2_opz_var1(), FLA_Fused_Her2_Ax_l_opc_var1(), FLA_Fused_Her2_Ax_l_opd_var1(), FLA_Fused_Her2_Ax_l_ops_var1(), FLA_Fused_Her2_Ax_l_opz_var1(), FLA_Fused_Uhu_Yhu_Zhu_opc_var1(), FLA_Fused_Uhu_Yhu_Zhu_opd_var1(), FLA_Fused_Uhu_Yhu_Zhu_ops_var1(), FLA_Fused_Uhu_Yhu_Zhu_opz_var1(), FLA_Fused_UYx_ZVx_opc_var1(), FLA_Fused_UYx_ZVx_opd_var1(), FLA_Fused_UYx_ZVx_ops_var1(), FLA_Fused_UYx_ZVx_opz_var1(), FLA_Fused_UZhu_ZUhu_opc_var1(), FLA_Fused_UZhu_ZUhu_opd_var1(), FLA_Fused_UZhu_ZUhu_ops_var1(), FLA_Fused_UZhu_ZUhu_opz_var1(), FLA_Givens2_opd(), FLA_Hess_UT_step_ofc_var2(), FLA_Hess_UT_step_ofc_var3(), FLA_Hess_UT_step_ofc_var4(), FLA_Hess_UT_step_ofd_var2(), FLA_Hess_UT_step_ofd_var3(), FLA_Hess_UT_step_ofd_var4(), FLA_Hess_UT_step_ofs_var2(), FLA_Hess_UT_step_ofs_var3(), FLA_Hess_UT_step_ofs_var4(), FLA_Hess_UT_step_ofz_var2(), FLA_Hess_UT_step_ofz_var3(), FLA_Hess_UT_step_ofz_var4(), FLA_Hess_UT_step_opc_var1(), FLA_Hess_UT_step_opc_var2(), FLA_Hess_UT_step_opc_var3(), FLA_Hess_UT_step_opc_var4(), FLA_Hess_UT_step_opc_var5(), FLA_Hess_UT_step_opd_var1(), FLA_Hess_UT_step_opd_var2(), FLA_Hess_UT_step_opd_var3(), FLA_Hess_UT_step_opd_var4(), FLA_Hess_UT_step_opd_var5(), FLA_Hess_UT_step_ops_var1(), FLA_Hess_UT_step_ops_var2(), FLA_Hess_UT_step_ops_var3(), FLA_Hess_UT_step_ops_var4(), FLA_Hess_UT_step_ops_var5(), FLA_Hess_UT_step_opz_var1(), FLA_Hess_UT_step_opz_var2(), FLA_Hess_UT_step_opz_var3(), FLA_Hess_UT_step_opz_var4(), FLA_Hess_UT_step_opz_var5(), FLA_Hevd_external(), FLA_Hevdd_external(), FLA_Hevdr_external(), FLA_LQ_UT_opc_var1(), FLA_LQ_UT_opc_var2(), FLA_LQ_UT_opd_var1(), FLA_LQ_UT_opd_var2(), FLA_LQ_UT_ops_var1(), FLA_LQ_UT_ops_var2(), FLA_LQ_UT_opz_var1(), FLA_LQ_UT_opz_var2(), FLA_LU_nopiv_opc_var1(), FLA_LU_nopiv_opc_var2(), FLA_LU_nopiv_opc_var3(), FLA_LU_nopiv_opc_var4(), FLA_LU_nopiv_opc_var5(), FLA_LU_nopiv_opd_var1(), FLA_LU_nopiv_opd_var2(), FLA_LU_nopiv_opd_var3(), FLA_LU_nopiv_opd_var4(), FLA_LU_nopiv_opd_var5(), FLA_LU_nopiv_ops_var1(), FLA_LU_nopiv_ops_var2(), FLA_LU_nopiv_ops_var3(), FLA_LU_nopiv_ops_var4(), FLA_LU_nopiv_ops_var5(), FLA_LU_nopiv_opz_var1(), FLA_LU_nopiv_opz_var2(), FLA_LU_nopiv_opz_var3(), FLA_LU_nopiv_opz_var4(), FLA_LU_nopiv_opz_var5(), FLA_LU_piv_opc_var3(), FLA_LU_piv_opc_var4(), FLA_LU_piv_opc_var5(), FLA_LU_piv_opd_var3(), FLA_LU_piv_opd_var4(), FLA_LU_piv_opd_var5(), FLA_LU_piv_ops_var3(), FLA_LU_piv_ops_var4(), FLA_LU_piv_ops_var5(), FLA_LU_piv_opz_var3(), FLA_LU_piv_opz_var4(), FLA_LU_piv_opz_var5(), FLA_Lyap_h_opc_var1(), FLA_Lyap_h_opc_var2(), FLA_Lyap_h_opc_var3(), FLA_Lyap_h_opc_var4(), FLA_Lyap_h_opd_var1(), FLA_Lyap_h_opd_var2(), FLA_Lyap_h_opd_var3(), FLA_Lyap_h_opd_var4(), FLA_Lyap_h_ops_var1(), FLA_Lyap_h_ops_var2(), FLA_Lyap_h_ops_var3(), FLA_Lyap_h_ops_var4(), FLA_Lyap_h_opz_var1(), FLA_Lyap_h_opz_var2(), FLA_Lyap_h_opz_var3(), FLA_Lyap_h_opz_var4(), FLA_Lyap_n_opc_var1(), FLA_Lyap_n_opc_var2(), FLA_Lyap_n_opc_var3(), FLA_Lyap_n_opc_var4(), FLA_Lyap_n_opd_var1(), FLA_Lyap_n_opd_var2(), FLA_Lyap_n_opd_var3(), FLA_Lyap_n_opd_var4(), FLA_Lyap_n_ops_var1(), FLA_Lyap_n_ops_var2(), FLA_Lyap_n_ops_var3(), FLA_Lyap_n_ops_var4(), FLA_Lyap_n_opz_var1(), FLA_Lyap_n_opz_var2(), FLA_Lyap_n_opz_var3(), FLA_Lyap_n_opz_var4(), FLA_Max_elemwise_diff(), FLA_Norm1_tridiag_opd(), FLA_Norm1_tridiag_ops(), FLA_Obj_equals(), FLA_Obj_fshow(), FLA_Obj_has_nan(), FLA_Obj_set_imag_part(), FLA_Obj_set_real_part(), FLA_QR2_UT_opc_var1(), FLA_QR2_UT_opd_var1(), FLA_QR2_UT_ops_var1(), FLA_QR2_UT_opz_var1(), FLA_QR_form_Q_external(), FLA_QR_UT_form_Q_opc_var1(), FLA_QR_UT_form_Q_opd_var1(), FLA_QR_UT_form_Q_ops_var1(), FLA_QR_UT_form_Q_opz_var1(), FLA_QR_UT_opc_var1(), FLA_QR_UT_opc_var2(), FLA_QR_UT_opd_var1(), FLA_QR_UT_opd_var2(), FLA_QR_UT_ops_var1(), FLA_QR_UT_ops_var2(), FLA_QR_UT_opz_var1(), FLA_QR_UT_opz_var2(), FLA_SA_Apply_pivots(), FLA_Scal_external_gpu(), FLA_Scalr_external_gpu(), FLA_Set_diagonal_matrix(), FLA_Set_diagonal_vector(), FLA_Shift_pivots_to(), FLA_Sort_bsvd_ext_b_opc(), FLA_Sort_bsvd_ext_b_opd(), FLA_Sort_bsvd_ext_b_ops(), FLA_Sort_bsvd_ext_b_opz(), FLA_Sort_bsvd_ext_f_opc(), FLA_Sort_bsvd_ext_f_opd(), FLA_Sort_bsvd_ext_f_ops(), FLA_Sort_bsvd_ext_f_opz(), FLA_Sort_evd_b_opd(), FLA_Sort_evd_b_opz(), FLA_Sort_evd_f_opd(), FLA_Sort_evd_f_opz(), FLA_Sort_svd_b_opd(), FLA_Sort_svd_b_opz(), FLA_Sort_svd_f_opd(), FLA_Sort_svd_f_opz(), FLA_Submatrix_at(), FLA_Svd_external(), FLA_Svdd_external(), FLA_Tevd_find_perfshift_opd(), FLA_Tevd_francis_n_opd_var1(), FLA_Tevd_francis_v_opd_var1(), FLA_Tevd_iteracc_n_opd_var1(), FLA_Tevd_iteracc_v_opd_var1(), FLA_Tevd_iteracc_v_opd_var3(), FLA_Tevdd_external(), FLA_Tevdr_external(), FLA_Tridiag_apply_Q_external(), FLA_Tridiag_UT_l_realify_opt(), FLA_Tridiag_UT_l_step_ofc_var2(), FLA_Tridiag_UT_l_step_ofc_var3(), FLA_Tridiag_UT_l_step_ofd_var2(), FLA_Tridiag_UT_l_step_ofd_var3(), FLA_Tridiag_UT_l_step_ofs_var2(), FLA_Tridiag_UT_l_step_ofs_var3(), FLA_Tridiag_UT_l_step_ofz_var2(), FLA_Tridiag_UT_l_step_ofz_var3(), FLA_Tridiag_UT_l_step_opc_var1(), FLA_Tridiag_UT_l_step_opc_var2(), FLA_Tridiag_UT_l_step_opc_var3(), FLA_Tridiag_UT_l_step_opd_var1(), FLA_Tridiag_UT_l_step_opd_var2(), FLA_Tridiag_UT_l_step_opd_var3(), FLA_Tridiag_UT_l_step_ops_var1(), FLA_Tridiag_UT_l_step_ops_var2(), FLA_Tridiag_UT_l_step_ops_var3(), FLA_Tridiag_UT_l_step_opz_var1(), FLA_Tridiag_UT_l_step_opz_var2(), FLA_Tridiag_UT_l_step_opz_var3(), FLA_Tridiag_UT_realify_subdiagonal_opt(), FLA_Tridiag_UT_u_realify_opt(), FLA_Trinv_ln_opc_var1(), FLA_Trinv_ln_opc_var2(), FLA_Trinv_ln_opc_var3(), FLA_Trinv_ln_opc_var4(), FLA_Trinv_ln_opd_var1(), FLA_Trinv_ln_opd_var2(), FLA_Trinv_ln_opd_var3(), FLA_Trinv_ln_opd_var4(), FLA_Trinv_ln_ops_var1(), FLA_Trinv_ln_ops_var2(), FLA_Trinv_ln_ops_var3(), FLA_Trinv_ln_ops_var4(), FLA_Trinv_ln_opz_var1(), FLA_Trinv_ln_opz_var2(), FLA_Trinv_ln_opz_var3(), FLA_Trinv_ln_opz_var4(), FLA_Trinv_lu_opc_var1(), FLA_Trinv_lu_opc_var2(), FLA_Trinv_lu_opc_var3(), FLA_Trinv_lu_opc_var4(), FLA_Trinv_lu_opd_var1(), FLA_Trinv_lu_opd_var2(), FLA_Trinv_lu_opd_var3(), FLA_Trinv_lu_opd_var4(), FLA_Trinv_lu_ops_var1(), FLA_Trinv_lu_ops_var2(), FLA_Trinv_lu_ops_var3(), FLA_Trinv_lu_ops_var4(), FLA_Trinv_lu_opz_var1(), FLA_Trinv_lu_opz_var2(), FLA_Trinv_lu_opz_var3(), FLA_Trinv_lu_opz_var4(), FLA_Trinv_un_opc_var1(), FLA_Trinv_un_opc_var2(), FLA_Trinv_un_opc_var3(), FLA_Trinv_un_opc_var4(), FLA_Trinv_un_opd_var1(), FLA_Trinv_un_opd_var2(), FLA_Trinv_un_opd_var3(), FLA_Trinv_un_opd_var4(), FLA_Trinv_un_ops_var1(), FLA_Trinv_un_ops_var2(), FLA_Trinv_un_ops_var3(), FLA_Trinv_un_ops_var4(), FLA_Trinv_un_opz_var1(), FLA_Trinv_un_opz_var2(), FLA_Trinv_un_opz_var3(), FLA_Trinv_un_opz_var4(), FLA_Trinv_uu_opc_var1(), FLA_Trinv_uu_opc_var2(), FLA_Trinv_uu_opc_var3(), FLA_Trinv_uu_opc_var4(), FLA_Trinv_uu_opd_var1(), FLA_Trinv_uu_opd_var2(), FLA_Trinv_uu_opd_var3(), FLA_Trinv_uu_opd_var4(), FLA_Trinv_uu_ops_var1(), FLA_Trinv_uu_ops_var2(), FLA_Trinv_uu_ops_var3(), FLA_Trinv_uu_ops_var4(), FLA_Trinv_uu_opz_var1(), FLA_Trinv_uu_opz_var2(), FLA_Trinv_uu_opz_var3(), FLA_Trinv_uu_opz_var4(), FLA_Ttmm_l_opc_var1(), FLA_Ttmm_l_opc_var2(), FLA_Ttmm_l_opc_var3(), FLA_Ttmm_l_opd_var1(), FLA_Ttmm_l_opd_var2(), FLA_Ttmm_l_opd_var3(), FLA_Ttmm_l_ops_var1(), FLA_Ttmm_l_ops_var2(), FLA_Ttmm_l_ops_var3(), FLA_Ttmm_l_opz_var1(), FLA_Ttmm_l_opz_var2(), FLA_Ttmm_l_opz_var3(), FLA_Ttmm_u_opc_var1(), FLA_Ttmm_u_opc_var2(), FLA_Ttmm_u_opc_var3(), FLA_Ttmm_u_opd_var1(), FLA_Ttmm_u_opd_var2(), FLA_Ttmm_u_opd_var3(), FLA_Ttmm_u_ops_var1(), FLA_Ttmm_u_ops_var2(), FLA_Ttmm_u_ops_var3(), FLA_Ttmm_u_opz_var1(), FLA_Ttmm_u_opz_var2(), FLA_Ttmm_u_opz_var3(), FLA_UDdate_UT_opc_var1(), FLA_UDdate_UT_opd_var1(), FLA_UDdate_UT_ops_var1(), FLA_UDdate_UT_opz_var1(), FLASH_Axpy_buffer_to_hier(), FLASH_Axpy_flat_to_hier(), FLASH_Axpy_hier_to_buffer(), FLASH_Axpy_hier_to_flat(), FLASH_Copy_buffer_to_hier(), FLASH_Copy_flat_to_hier(), FLASH_Copy_hier_to_buffer(), FLASH_Copy_hier_to_flat(), FLASH_Obj_base_scalar_length(), FLASH_Obj_create_helper(), FLASH_Obj_create_hierarchy(), FLASH_Obj_free_hierarchy(), FLASH_Obj_show_hierarchy(), FLASH_print_struct(), FLASH_print_struct_helper(), FLASH_Queue_check_gpu(), FLASH_Queue_create_gpu(), FLASH_Queue_destroy_gpu(), FLASH_Queue_exec(), FLASH_Queue_exec_gpu(), FLASH_Queue_exec_parallel(), FLASH_Queue_exec_parallel_function(), FLASH_Queue_exec_simulation(), FLASH_Queue_flush_gpu(), FLASH_Queue_init_tasks(), FLASH_Queue_mark_gpu(), FLASH_Queue_prefetch(), FLASH_Queue_prefetch_block(), FLASH_Queue_push(), FLASH_Queue_push_output(), FLASH_Queue_update_cache(), FLASH_Queue_update_cache_block(), FLASH_Queue_update_gpu(), FLASH_Queue_verbose_output(), FLASH_Queue_wait_dequeue_block(), FLASH_Queue_wait_enqueue(), FLASH_Task_free(), FLASH_Task_free_parallel(), FLASH_Task_update_dependencies(), and if().

◆ n_left

int n_left

◆ n_pre

int n_pre

◆ n_run

int n_run

◆ psi1

dcomplex *restrict psi1

◆ zeta1

dcomplex *restrict zeta1 = z