dnn__opt_8h_source.html

 // Copyright 2019 Claes Rolen (www.rolensystems.com)
 //
 //   Licensed under the Apache License, Version 2.0 (the "License");
 //   you may not use this file except in compliance with the License.
 //   You may obtain a copy of the License at
 //
 //     http://www.apache.org/licenses/LICENSE-2.0
 //
 //   Unless required by applicable law or agreed to in writing, software
 //   distributed under the License is distributed on an "AS IS" BASIS,
 //   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 //   See the License for the specific language governing permissions and
 //   limitations under the License.

 #pragma once
 namespace dnn
 {

 class opt
 {
 protected:
     std::string alg;
     DNN_Dtype lr;
     DNN_Dtype reg_lambda;
     DNN_Dtype reg_alpha;
     LR_ALG    lr_alg;
     DNN_Dtype lr_0;
     DNN_Dtype lr_a;
     DNN_Dtype lr_b;
     arma::uword it;
 public:
     opt()
     {
         lr_alg = LR_ALG::CONST;
         lr_0   = 1;
         it     = 0;
     };

     ~opt() {};

     virtual void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad ) = 0;

     virtual std::string get_algorithm(void)
     {
         return alg;
     }

     void set_learn_rate_alg(LR_ALG alg, DNN_Dtype a=0.0, DNN_Dtype b=10.0 )
     {
         lr_alg = alg;
         lr_a   = a;
         lr_b   = b;
         it     = 0;  // Reset counter
     }

     void update_learn_rate(void)
     {
         it++; // Increase counter
         switch (lr_alg)
         {
         case LR_ALG::TIME_DECAY:     // lr_a = time decay
             lr = lr_0/(1+lr_a*it);
             break;
         case LR_ALG::STEP_DECAY:     // lr_a = drop factor, lr_b = time interval
             lr = lr_0*std::pow(lr_a,std::floor(it/lr_b));
             break;
         case LR_ALG::EXP_DECAY:     // lr_p1 = dec rate
             lr = lr_0*std::exp(-lr_a*it);
             break;

         default:
             break;
         }
     }

     DNN_Dtype get_learn_rate(void)
     {
         return lr;
     }

 }; // End class opt


 class opt_SGD:public opt
 {
 public:
     opt_SGD(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0):opt()
     {
         lr     = s;
         lr_0   = lr;
         reg_lambda  = l;
         reg_alpha  = a;
         alg = "SGD";
     };

     ~opt_SGD() {};

     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         // Add regularization
         const arma::Cube<DNN_Dtype> dw=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         W  = W - lr*dw;
         B  = B - lr*Bgrad;

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g)",lr);
         return alg+p;
     }
 }; // End class opt_SGD


 class opt_SGD_momentum:public opt
 {
 private:
     arma::Cube<DNN_Dtype> v;
     arma::Mat<DNN_Dtype> vB;
     DNN_Dtype mom;
 public:
     opt_SGD_momentum(DNN_Dtype s, DNN_Dtype m, DNN_Dtype l=0.0, DNN_Dtype a=0.0):opt()
     {
         lr          = s;
         lr_0        = lr;
         reg_lambda  = l;
         reg_alpha   = a;
         mom         = m;
         alg         = "SGD_mom";
     };

     ~opt_SGD_momentum() {};

     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         if(v.n_elem==0)
         {
             v.set_size(arma::size(W));
             v.zeros();
             vB.set_size(arma::size(B));
             vB.zeros();
         }

         // Add regularization
         const arma::Cube<DNN_Dtype> dw=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         v  = mom*v - lr*dw;
         W  = W + v;
         vB = mom*vB - lr*Bgrad ;
         B  = B + vB;

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g,%g)",lr,mom);
         return alg+p;
     }
 }; // End class opt_SGD_momentum


 class opt_SGD_nesterov:public opt
 {
 private:
     arma::Cube<DNN_Dtype> v;
     arma::Cube<DNN_Dtype> vp;
     arma::Mat<DNN_Dtype> vB;
     arma::Mat<DNN_Dtype> vBp;
     DNN_Dtype mom;
 public:
     opt_SGD_nesterov(DNN_Dtype s, DNN_Dtype m, DNN_Dtype l=0.0, DNN_Dtype a=0.0):opt()
     {
         lr         = s;
         lr_0       = lr;
         reg_lambda = l;
         reg_alpha  = a;
         mom        = m;
         alg        = "SGD_nest";
     };

     ~opt_SGD_nesterov() {};

     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         if(v.n_elem==0)
         {
             v.set_size(arma::size(W));
             v.zeros();
             vp.set_size(arma::size(W));
             vp.zeros();
             vB.set_size(arma::size(B));
             vB.zeros();
             vBp.set_size(arma::size(B));
             vBp.zeros();
         }

         // Add regularization
         const arma::Cube<DNN_Dtype> dw=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         vp = v;
         v  = mom*v - lr*dw;
         W  = W - mom*vp + (1+mom)*v;

         vBp = vB;
         vB  = mom*vB - lr*Bgrad ;
         B   = B -mom*vBp +(1+mom)*vB;

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g,%g)",lr,mom);
         return alg+p;
     }
 }; // End class opt_SGD_nesterov


 class opt_adam:public opt
 {
 private:
     arma::Cube<DNN_Dtype> v;
     arma::Cube<DNN_Dtype> m;
     arma::Mat<DNN_Dtype> vB;
     arma::Mat<DNN_Dtype> mB;
     DNN_Dtype beta1;
     DNN_Dtype beta2;
     DNN_Dtype eps;
 public:

     opt_adam(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype b1=0.9,DNN_Dtype b2=0.999, DNN_Dtype e=1e-8):opt()
     {
         lr         = s;
         lr_0       = lr;
         reg_lambda = l;
         reg_alpha  = a;
         beta1      = b1;
         beta2      = b2;
         eps        = e;
         alg        = "ADAM";
     };

     ~opt_adam() {};

     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         if(v.n_elem==0)
         {
             v.set_size(arma::size(W));
             v.zeros();
             m.set_size(arma::size(W));
             m.zeros();
             vB.set_size(arma::size(B));
             vB.zeros();
             mB.set_size(arma::size(B));
             mB.zeros();
         }

         // Add regularization
         const arma::Cube<DNN_Dtype> dw=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         for (arma::uword k=0;k<v.n_elem;k++ )
         {
             m(k)  = beta1*m(k) +(1-beta1)*dw(k);
             v(k)  = beta2*v(k) +(1-beta2)*dw(k)*dw(k);
             W(k)  = W(k) - lr*(std::sqrt(1-beta2)/(1-beta1))*m(k)/(std::sqrt(v(k))+eps);
         }
         for (arma::uword k=0;k<vB.n_elem;k++ )
         {
             mB(k)  = beta1*mB(k) +(1-beta1)*Bgrad(k);
             vB(k)  = beta2*vB(k) +(1-beta2)*Bgrad(k)*Bgrad(k);
             B(k)   = B(k) - lr*(std::sqrt(1-beta2)/(1-beta1))*mB(k)/(std::sqrt(vB(k))+eps);
         }

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g)",lr);
         return alg+p;
     }
 }; // End class opt_adam


 class opt_adamax:public opt
 {
 private:
     arma::Cube<DNN_Dtype> v;
     arma::Cube<DNN_Dtype> m;
     arma::Mat<DNN_Dtype> vB;
     arma::Mat<DNN_Dtype> mB;
     DNN_Dtype beta1;
     DNN_Dtype beta2;
     DNN_Dtype eps;
 public:

     opt_adamax(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype b1=0.9,DNN_Dtype b2=0.999, DNN_Dtype e=1e-8):opt()
     {
         lr         = s;
         lr_0       = lr;
         reg_lambda = l;
         reg_alpha  = a;
         beta1      = b1;
         beta2      = b2;
         eps        = e;
         alg        = "ADAmax";
     };

     ~opt_adamax() {};

     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         if(v.n_elem==0)
         {
             v.set_size(arma::size(W));
             v.zeros();
             m.set_size(arma::size(W));
             m.zeros();
             vB.set_size(arma::size(B));
             vB.zeros();
             mB.set_size(arma::size(B));
             mB.zeros();
         }

         // Add regularization
         const arma::Cube<DNN_Dtype> dw=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         for (arma::uword k=0;k<v.n_elem;k++ )
         {
             m(k) = beta1*m(k) +(1-beta1)*dw(k);
             v(k) = (beta2*v(k)> std::abs(dw(k))) ? beta2*v(k) : std::abs(dw(k));
             W(k) = W(k) - lr*(std::sqrt(1-beta2)/(1-beta1))*m(k)/(v(k)+eps);
         }
         for (arma::uword k=0;k<vB.n_elem;k++ )
         {
             mB(k) = beta1*mB(k) +(1-beta1)*Bgrad(k);
             vB(k) = (beta2*vB(k)> std::abs(Bgrad(k))) ? beta2*vB(k) : std::abs(Bgrad(k));
             B(k)  = B(k) - lr*(std::sqrt(1-beta2)/(1-beta1))*mB(k)/(vB(k)+eps);
         }

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g)",lr);
         return alg+p;
     }
 }; // End class opt_adamax


 class opt_adadelta:public opt
 {
 private:
     arma::Cube<DNN_Dtype> Ew;
     arma::Cube<DNN_Dtype> dW;
     arma::Mat<DNN_Dtype> Eb;
     arma::Mat<DNN_Dtype> dB;
     DNN_Dtype rho;
     DNN_Dtype eps;
 public:
     opt_adadelta(DNN_Dtype r, DNN_Dtype s=1.0, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype e=1e-6):opt()
     {
         rho        = r;
         lr         = s;
         lr_0       = s;
         reg_lambda = l;
         reg_alpha  = a;
         eps        = e;
         alg        = "ADAdelta";
     };

     ~opt_adadelta(){};

     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         if(Ew.n_elem==0)
         {
             Ew.set_size(arma::size(W));
             Ew.zeros();
             dW.set_size(arma::size(W));
             dW.zeros();
             Eb.set_size(arma::size(B));
             Eb.zeros();
             dB.set_size(arma::size(B));
             dB.zeros();
         }

         // Add regularization
         const arma::Cube<DNN_Dtype> w=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         for (arma::uword k=0 ;k<W.n_elem ; k++ )
         {
             Ew(k) = rho*Ew(k)+(1-rho)*w(k)*w(k);

             DNN_Dtype upd = lr*w(k)*sqrt(dW(k)+eps)/sqrt(Ew(k)+eps);
             W(k)  = W(k)-upd;
             dW(k) = rho*dW(k)+(1-rho)*upd*upd;
         }
         for (arma::uword k=0 ;k<B.n_elem ; k++ )
         {
             Eb(k) = rho*Eb(k)+(1-rho)*Bgrad(k)*Bgrad(k);

             DNN_Dtype upd = lr*Bgrad(k)*sqrt(dB(k)+eps)/sqrt(Eb(k)+eps);;
             B(k)  = B(k)-upd;
             dB(k) = rho*dB(k)+(1-rho)*upd*upd;
         }

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g)",rho);
         return alg+p;
     }
 }; // End class opt_adadelta


 class opt_adagrad:public opt
 {
 private:
     arma::Cube<DNN_Dtype> v;
     arma::Mat<DNN_Dtype> vB;
     DNN_Dtype eps;
 public:
     opt_adagrad(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype e=1e-8):opt()
     {
         lr         = s;
         lr_0       = lr;
         reg_lambda = l;
         reg_alpha  = a;
         eps        = e;
         alg        = "ADAgrad";
     };
     ~opt_adagrad() {};


     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         if(v.n_elem==0)
         {
             v.set_size(arma::size(W));
             v.zeros();
             vB.set_size(arma::size(B));
             vB.zeros();
         }

         // Add regularization
         const arma::Cube<DNN_Dtype> dw=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         for (arma::uword k=0 ;k<W.n_elem ; k++ )
         {
             v(k) = v(k)+dw(k)*dw(k);
             W(k) = W(k)-lr*dw(k)/std::sqrt(v(k)+eps);
         }
         for (arma::uword k=0 ;k<B.n_elem ; k++ )
         {
             vB(k) = vB(k)+Bgrad(k)*Bgrad(k);
             B(k) = B(k)-lr*Bgrad(k)/std::sqrt(vB(k)+eps);
         }

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g)",lr);
         return alg+p;
     }
 }; // End class opt_adagrad


 class opt_rmsprop:public opt
 {
 private:
     arma::Cube<DNN_Dtype> v;
     arma::Mat<DNN_Dtype> vB;
     DNN_Dtype beta;
     DNN_Dtype eps;
 public:
     opt_rmsprop(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, const DNN_Dtype b=0.9, DNN_Dtype e=1e-8):opt()
     {
         lr         = s;
         lr_0       = lr;
         reg_lambda = l;
         reg_alpha  = a;
         beta       = b;
         eps        = e;
         alg        = "RMSprop";
     };

     ~opt_rmsprop() {};

     void apply(arma::Cube<DNN_Dtype>& W,
                arma::Mat<DNN_Dtype>& B,
                const arma::Cube<DNN_Dtype>& Wgrad,
                const arma::Mat<DNN_Dtype>& Bgrad )
     {
         if(v.n_elem==0)
         {
             v.set_size(arma::size(W));
             v.zeros();
             vB.set_size(arma::size(B));
             vB.zeros();
         }

         // Add regularization
         const arma::Cube<DNN_Dtype> dw=Wgrad+reg_lambda*(reg_alpha*arma::sign(W)+(1-reg_alpha)*W);

         // Update params
         for (arma::uword k=0 ;k<W.n_elem ; k++ )
         {
             v(k) = beta*v(k)+(1-beta)*dw(k)*dw(k);
             W(k) = W(k)-lr*dw(k)/std::sqrt(v(k)+eps);
         }
         for (arma::uword k=0 ;k<B.n_elem ; k++ )
         {
             vB(k) = beta*vB(k)+(1-beta)*Bgrad(k)*Bgrad(k);
             B(k) = B(k)-lr*Bgrad(k)/std::sqrt(vB(k)+eps);
         }

         // Update learning rate
         update_learn_rate();
     }

     std::string get_algorithm(void)
     {
         char p[100];
         std::snprintf(p,100,"(%g,%g)",lr,beta);
         return alg+p;
     }
 }; // End class opt_rmsprop
 } // End namespace dnn
dnn::opt_adam::m
arma::Cube< DNN_Dtype > m
Definition: dnn_opt.h:360

dnn::opt::opt
opt()
Definition: dnn_opt.h:44

dnn::opt_adam::eps
DNN_Dtype eps
Definition: dnn_opt.h:365

dnn::opt_SGD_momentum::opt_SGD_momentum
opt_SGD_momentum(DNN_Dtype s, DNN_Dtype m, DNN_Dtype l=0.0, DNN_Dtype a=0.0)
SGD with momentum constructor.
Definition: dnn_opt.h:208

dnn::opt_SGD::opt_SGD
opt_SGD(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0)
SGD constructor.
Definition: dnn_opt.h:143

dnn::opt_SGD_nesterov::~opt_SGD_nesterov
~opt_SGD_nesterov()
Definition: dnn_opt.h:297

dnn::opt_adam::vB
arma::Mat< DNN_Dtype > vB
Definition: dnn_opt.h:361

dnn::opt_rmsprop::v
arma::Cube< DNN_Dtype > v
Definition: dnn_opt.h:734

dnn::opt_SGD_nesterov::mom
DNN_Dtype mom
Definition: dnn_opt.h:278

dnn::LR_ALG::CONST

dnn::opt_adamax::mB
arma::Mat< DNN_Dtype > mB
Definition: dnn_opt.h:459

dnn::opt_adagrad::vB
arma::Mat< DNN_Dtype > vB
Definition: dnn_opt.h:652

dnn::opt_adagrad::eps
DNN_Dtype eps
Definition: dnn_opt.h:653

dnn::opt_adagrad::opt_adagrad
opt_adagrad(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype e=1e-8)
ADAgrad constructor.
Definition: dnn_opt.h:663

dnn::opt_adagrad::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:680

dnn::opt_adadelta::opt_adadelta
opt_adadelta(DNN_Dtype r, DNN_Dtype s=1.0, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype e=1e-6)
ADAdelta constructor.
Definition: dnn_opt.h:569

dnn::opt_adadelta::Ew
arma::Cube< DNN_Dtype > Ew
Definition: dnn_opt.h:554

dnn::opt_adamax::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:493

dnn::opt_rmsprop::eps
DNN_Dtype eps
Definition: dnn_opt.h:737

dnn::LR_ALG::EXP_DECAY

dnn::opt::it
arma::uword it
Iteration counter.
Definition: dnn_opt.h:42

dnn::opt_SGD_momentum::v
arma::Cube< DNN_Dtype > v
Velocity internal variable for weight.
Definition: dnn_opt.h:197

dnn::opt_SGD_momentum::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:256

dnn::opt_adam::beta1
DNN_Dtype beta1
Definition: dnn_opt.h:363

dnn::opt::lr_a
DNN_Dtype lr_a
Internal parameter a.
Definition: dnn_opt.h:40

dnn::opt_rmsprop
RMSprop optimizer class.
Definition: dnn_opt.h:731

dnn::opt_SGD_momentum::vB
arma::Mat< DNN_Dtype > vB
Velocity internal variable for bias.
Definition: dnn_opt.h:198

dnn::opt_adam::mB
arma::Mat< DNN_Dtype > mB
Definition: dnn_opt.h:362

dnn::opt_adadelta::rho
DNN_Dtype rho
Definition: dnn_opt.h:558

dnn::opt_rmsprop::beta
DNN_Dtype beta
Definition: dnn_opt.h:736

dnn::opt::~opt
~opt()
Definition: dnn_opt.h:51

dnn::opt_adagrad
ADAgrad optimizer class.
Definition: dnn_opt.h:648

dnn::opt_adam::v
arma::Cube< DNN_Dtype > v
Definition: dnn_opt.h:359

dnn::opt_SGD_momentum::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:225

dnn::opt_SGD::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:159

dnn::opt_SGD::~opt_SGD
~opt_SGD()
Definition: dnn_opt.h:152

dnn::opt::lr
DNN_Dtype lr
Learning rate.
Definition: dnn_opt.h:35

dnn::opt_adamax
ADAMax optimizer class.
Definition: dnn_opt.h:453

dnn::opt_SGD_nesterov::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:304

dnn::opt_adadelta::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:633

dnn::opt_adam::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:396

dnn::opt::set_learn_rate_alg
void set_learn_rate_alg(LR_ALG alg, DNN_Dtype a=0.0, DNN_Dtype b=10.0)
Set learning rate algorithm.
Definition: dnn_opt.h:84

dnn::opt_SGD_momentum
Stochastic Gradient Descent with momentum optimizer class.
Definition: dnn_opt.h:194

dnn::opt_adamax::opt_adamax
opt_adamax(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype b1=0.9, DNN_Dtype b2=0.999, DNN_Dtype e=1e-8)
ADAMax constructor.
Definition: dnn_opt.h:474

dnn::LR_ALG::STEP_DECAY

dnn::opt_rmsprop::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:765

dnn::LR_ALG::TIME_DECAY

dnn::opt_adadelta
ADAdelta optimizer class.
Definition: dnn_opt.h:551

dnn::opt::reg_lambda
DNN_Dtype reg_lambda
Regularisation parameter lambda.
Definition: dnn_opt.h:36

dnn::opt::get_learn_rate
DNN_Dtype get_learn_rate(void)
Get the learning rate.
Definition: dnn_opt.h:120

dnn::DNN_Dtype
float DNN_Dtype
Data type used in the network (float or double)
Definition: dnn.h:28

dnn::opt_adadelta::eps
DNN_Dtype eps
Definition: dnn_opt.h:559

dnn::opt_SGD
Stochastic Gradient Descent optimizer class.
Definition: dnn_opt.h:134

dnn::opt_rmsprop::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:801

dnn::opt_adam::~opt_adam
~opt_adam()
Definition: dnn_opt.h:389

dnn::opt::alg
std::string alg
Definition: dnn_opt.h:34

dnn::opt_adamax::m
arma::Cube< DNN_Dtype > m
Definition: dnn_opt.h:457

dnn::opt_adamax::beta1
DNN_Dtype beta1
Definition: dnn_opt.h:460

dnn::opt_SGD_nesterov::vp
arma::Cube< DNN_Dtype > vp
Definition: dnn_opt.h:275

dnn::opt::lr_0
DNN_Dtype lr_0
Init value for lr.
Definition: dnn_opt.h:39

dnn::opt_rmsprop::~opt_rmsprop
~opt_rmsprop()
Definition: dnn_opt.h:758

dnn::opt::apply
virtual void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)=0
Apply the optimizer to the layer parameters.

dnn::LR_ALG
LR_ALG
Definition: dnn.h:35

dnn::opt_adam::opt_adam
opt_adam(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, DNN_Dtype b1=0.9, DNN_Dtype b2=0.999, DNN_Dtype e=1e-8)
ADAM constructor.
Definition: dnn_opt.h:377

dnn::opt_adamax::~opt_adamax
~opt_adamax()
Definition: dnn_opt.h:486

dnn::opt_adagrad::v
arma::Cube< DNN_Dtype > v
Definition: dnn_opt.h:651

dnn
Definition: dnn.h:22

dnn::opt_SGD_nesterov::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:341

dnn::opt_adadelta::apply
void apply(arma::Cube< DNN_Dtype > &W, arma::Mat< DNN_Dtype > &B, const arma::Cube< DNN_Dtype > &Wgrad, const arma::Mat< DNN_Dtype > &Bgrad)
Apply the optimizer to the layer parameters.
Definition: dnn_opt.h:587

dnn::opt_adam::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:438

dnn::opt_adadelta::dW
arma::Cube< DNN_Dtype > dW
Definition: dnn_opt.h:555

dnn::opt::lr_alg
LR_ALG lr_alg
Learning rate schedule algorithm.
Definition: dnn_opt.h:38

dnn::opt_SGD_nesterov::vB
arma::Mat< DNN_Dtype > vB
Definition: dnn_opt.h:276

dnn::opt_SGD::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:179

dnn::opt::get_algorithm
virtual std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:67

dnn::opt_adamax::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:536

dnn::opt_adamax::eps
DNN_Dtype eps
Definition: dnn_opt.h:462

dnn::opt_adamax::v
arma::Cube< DNN_Dtype > v
Definition: dnn_opt.h:456

dnn::opt_SGD_momentum::mom
DNN_Dtype mom
Definition: dnn_opt.h:199

dnn::opt_adagrad::get_algorithm
std::string get_algorithm(void)
Get the optimizer algorithm information.
Definition: dnn_opt.h:716

dnn::opt::reg_alpha
DNN_Dtype reg_alpha
Elastic net mix parameter - 0=ridge (L2) .. 1=LASSO (L1)
Definition: dnn_opt.h:37

dnn::opt_adagrad::~opt_adagrad
~opt_adagrad()
Definition: dnn_opt.h:672

dnn::opt_SGD_nesterov::v
arma::Cube< DNN_Dtype > v
Definition: dnn_opt.h:274

dnn::opt::lr_b
DNN_Dtype lr_b
Internal parameter b.
Definition: dnn_opt.h:41

dnn::opt_adadelta::Eb
arma::Mat< DNN_Dtype > Eb
Definition: dnn_opt.h:556

dnn::opt_adam::beta2
DNN_Dtype beta2
Definition: dnn_opt.h:364

dnn::opt_SGD_nesterov
Stochastic Gradient Descent with Nesterov momentum optimizer class.
Definition: dnn_opt.h:271

dnn::opt_SGD_nesterov::opt_SGD_nesterov
opt_SGD_nesterov(DNN_Dtype s, DNN_Dtype m, DNN_Dtype l=0.0, DNN_Dtype a=0.0)
SGD with Nesterov momentum constructor.
Definition: dnn_opt.h:287

dnn::opt_adadelta::dB
arma::Mat< DNN_Dtype > dB
Definition: dnn_opt.h:557

dnn::opt_adamax::beta2
DNN_Dtype beta2
Definition: dnn_opt.h:461

dnn::opt_rmsprop::opt_rmsprop
opt_rmsprop(DNN_Dtype s, DNN_Dtype l=0.0, DNN_Dtype a=0.0, const DNN_Dtype b=0.9, DNN_Dtype e=1e-8)
RMSprop constructor.
Definition: dnn_opt.h:747

dnn::opt::update_learn_rate
void update_learn_rate(void)
Update learning rate.
Definition: dnn_opt.h:97

dnn::opt_SGD_momentum::~opt_SGD_momentum
~opt_SGD_momentum()
Definition: dnn_opt.h:218

dnn::opt_adam
ADAM optimizer class.
Definition: dnn_opt.h:356

dnn::opt_adadelta::~opt_adadelta
~opt_adadelta()
Definition: dnn_opt.h:580

dnn::opt
Optimizer base class.
Definition: dnn_opt.h:31

dnn::opt_rmsprop::vB
arma::Mat< DNN_Dtype > vB
Definition: dnn_opt.h:735

dnn::opt_SGD_nesterov::vBp
arma::Mat< DNN_Dtype > vBp
Definition: dnn_opt.h:277

dnn::opt_adamax::vB
arma::Mat< DNN_Dtype > vB
Definition: dnn_opt.h:458