MR_LIBS/rank__objective_8hpp_source.html

#ifndef LIGHTGBM_OBJECTIVE_RANK_OBJECTIVE_HPP_

#define LIGHTGBM_OBJECTIVE_RANK_OBJECTIVE_HPP_


#include <LightGBM/objective_function.h>

#include <LightGBM/metric.h>


#include <cstdio>

#include <cstring>

#include <cmath>


#include <vector>

#include <algorithm>

#include <limits>


namespace LightGBM {


class LambdarankNDCG: public ObjectiveFunction {

public:

  explicit LambdarankNDCG(const Config& config) {

    sigmoid_ = static_cast<double>(config.sigmoid);

    label_gain_ = config.label_gain;

    // initialize DCG calculator

    DCGCalculator::DefaultLabelGain(&label_gain_);

    DCGCalculator::Init(label_gain_);

    // will optimize NDCG@optimize_pos_at_

    optimize_pos_at_ = config.max_position;

    sigmoid_table_.clear();

    inverse_max_dcgs_.clear();

    if (sigmoid_ <= 0.0) {

      Log::Fatal("Sigmoid param %f should be greater than zero", sigmoid_);

    }

  }


  explicit LambdarankNDCG(const std::vector<std::string>&) {

  }


  ~LambdarankNDCG() {

  }


  void Init(const Metadata& metadata, data_size_t num_data) override {

    num_data_ = num_data;

    // get label

    label_ = metadata.label();

    DCGCalculator::CheckLabel(label_, num_data_);

    // get weights

    weights_ = metadata.weights();

    // get boundries

    query_boundaries_ = metadata.query_boundaries();

    if (query_boundaries_ == nullptr) {

      Log::Fatal("Lambdarank tasks require query information");

    }

    num_queries_ = metadata.num_queries();

    // cache inverse max DCG, avoid computation many times

    inverse_max_dcgs_.resize(num_queries_);

#pragma omp parallel for schedule(static)

    for (data_size_t i = 0; i < num_queries_; ++i) {

      inverse_max_dcgs_[i] = DCGCalculator::CalMaxDCGAtK(optimize_pos_at_,

        label_ + query_boundaries_[i],

        query_boundaries_[i + 1] - query_boundaries_[i]);


      if (inverse_max_dcgs_[i] > 0.0) {

        inverse_max_dcgs_[i] = 1.0f / inverse_max_dcgs_[i];

      }

    }

    // construct sigmoid table to speed up sigmoid transform

    ConstructSigmoidTable();

  }


  void GetGradients(const double* score, score_t* gradients,

                    score_t* hessians) const override {

    #pragma omp parallel for schedule(guided)

    for (data_size_t i = 0; i < num_queries_; ++i) {

      GetGradientsForOneQuery(score, gradients, hessians, i);

    }

  }


  inline void GetGradientsForOneQuery(const double* score,

              score_t* lambdas, score_t* hessians, data_size_t query_id) const {

    // get doc boundary for current query

    const data_size_t start = query_boundaries_[query_id];

    const data_size_t cnt =

      query_boundaries_[query_id + 1] - query_boundaries_[query_id];

    // get max DCG on current query

    const double inverse_max_dcg = inverse_max_dcgs_[query_id];

    // add pointers with offset

    const label_t* label = label_ + start;

    score += start;

    lambdas += start;

    hessians += start;

    // initialize with zero

    for (data_size_t i = 0; i < cnt; ++i) {

      lambdas[i] = 0.0f;

      hessians[i] = 0.0f;

    }

    // get sorted indices for scores

    std::vector<data_size_t> sorted_idx;

    for (data_size_t i = 0; i < cnt; ++i) {

      sorted_idx.emplace_back(i);

    }

    std::stable_sort(sorted_idx.begin(), sorted_idx.end(),

                     [score](data_size_t a, data_size_t b) { return score[a] > score[b]; });

    // get best and worst score

    const double best_score = score[sorted_idx[0]];

    data_size_t worst_idx = cnt - 1;

    if (worst_idx > 0 && score[sorted_idx[worst_idx]] == kMinScore) {

      worst_idx -= 1;

    }

    const double wrost_score = score[sorted_idx[worst_idx]];

    // start accmulate lambdas by pairs

    for (data_size_t i = 0; i < cnt; ++i) {

      const data_size_t high = sorted_idx[i];

      const int high_label = static_cast<int>(label[high]);

      const double high_score = score[high];

      if (high_score == kMinScore) { continue; }

      const double high_label_gain = label_gain_[high_label];

      const double high_discount = DCGCalculator::GetDiscount(i);

      double high_sum_lambda = 0.0;

      double high_sum_hessian = 0.0;

      for (data_size_t j = 0; j < cnt; ++j) {

        // skip same data

        if (i == j) { continue; }


        const data_size_t low = sorted_idx[j];

        const int low_label = static_cast<int>(label[low]);

        const double low_score = score[low];

        // only consider pair with different label

        if (high_label <= low_label || low_score == kMinScore) { continue; }


        const double delta_score = high_score - low_score;


        const double low_label_gain = label_gain_[low_label];

        const double low_discount = DCGCalculator::GetDiscount(j);

        // get dcg gap

        const double dcg_gap = high_label_gain - low_label_gain;

        // get discount of this pair

        const double paired_discount = fabs(high_discount - low_discount);

        // get delta NDCG

        double delta_pair_NDCG = dcg_gap * paired_discount * inverse_max_dcg;

        // regular the delta_pair_NDCG by score distance

        if (high_label != low_label && best_score != wrost_score) {

          delta_pair_NDCG /= (0.01f + fabs(delta_score));

        }

        // calculate lambda for this pair

        double p_lambda = GetSigmoid(delta_score);

        double p_hessian = p_lambda * (2.0f - p_lambda);

        // update

        p_lambda *= -delta_pair_NDCG;

        p_hessian *= 2 * delta_pair_NDCG;

        high_sum_lambda += p_lambda;

        high_sum_hessian += p_hessian;

        lambdas[low] -= static_cast<score_t>(p_lambda);

        hessians[low] += static_cast<score_t>(p_hessian);

      }

      // update

      lambdas[high] += static_cast<score_t>(high_sum_lambda);

      hessians[high] += static_cast<score_t>(high_sum_hessian);

    }

    // if need weights

    if (weights_ != nullptr) {

      for (data_size_t i = 0; i < cnt; ++i) {

        lambdas[i] = static_cast<score_t>(lambdas[i] * weights_[start + i]);

        hessians[i] = static_cast<score_t>(hessians[i] * weights_[start + i]);

      }

    }

  }


  inline double GetSigmoid(double score) const {

    if (score <= min_sigmoid_input_) {

      // too small, use lower bound

      return sigmoid_table_[0];

    } else if (score >= max_sigmoid_input_) {

      // too big, use upper bound

      return sigmoid_table_[_sigmoid_bins - 1];

    } else {

      return sigmoid_table_[static_cast<size_t>((score - min_sigmoid_input_) * sigmoid_table_idx_factor_)];

    }

  }


  void ConstructSigmoidTable() {

    // get boundary

    min_sigmoid_input_ = min_sigmoid_input_ / sigmoid_ / 2;

    max_sigmoid_input_ = -min_sigmoid_input_;

    sigmoid_table_.resize(_sigmoid_bins);

    // get score to bin factor

    sigmoid_table_idx_factor_ =

      _sigmoid_bins / (max_sigmoid_input_ - min_sigmoid_input_);

    // cache

    for (size_t i = 0; i < _sigmoid_bins; ++i) {

      const double score = i / sigmoid_table_idx_factor_ + min_sigmoid_input_;

      sigmoid_table_[i] = 2.0f / (1.0f + std::exp(2.0f * score * sigmoid_));

    }

  }


  const char* GetName() const override {

    return "lambdarank";

  }


  std::string ToString() const override {

    std::stringstream str_buf;

    str_buf << GetName();

    return str_buf.str();

  }


  bool NeedAccuratePrediction() const override { return false; }


private:

  std::vector<double> label_gain_;

  std::vector<double> inverse_max_dcgs_;

  double sigmoid_;

  int optimize_pos_at_;

  data_size_t num_queries_;

  data_size_t num_data_;

  const label_t* label_;

  const label_t* weights_;

  const data_size_t* query_boundaries_;

  std::vector<double> sigmoid_table_;

  size_t _sigmoid_bins = 1024 * 1024;

  double min_sigmoid_input_ = -50;

  double max_sigmoid_input_ = 50;

  double sigmoid_table_idx_factor_;

};


}  // namespace LightGBM

#endif   // LightGBM_OBJECTIVE_RANK_OBJECTIVE_HPP_

LightGBM::DCGCalculator::CheckLabel
static void CheckLabel(const label_t *label, data_size_t num_data)
Check the label range for NDCG and lambdarank.
Definition dcg_calculator.cpp:152

LightGBM::DCGCalculator::Init
static void Init(const std::vector< double > &label_gain)
Initial logic.
Definition dcg_calculator.cpp:40

LightGBM::DCGCalculator::GetDiscount
static double GetDiscount(data_size_t k)
Get discount score of position k.
Definition metric.h:124

LightGBM::DCGCalculator::CalMaxDCGAtK
static double CalMaxDCGAtK(data_size_t k, const label_t *label, data_size_t num_data)
Calculate the Max DCG score at position k.
Definition dcg_calculator.cpp:51

LightGBM::LambdarankNDCG
Objective function for Lambdrank with NDCG.
Definition rank_objective.hpp:19

LightGBM::LambdarankNDCG::Init
void Init(const Metadata &metadata, data_size_t num_data) override
Initialize.
Definition rank_objective.hpp:41

LightGBM::LambdarankNDCG::GetGradients
void GetGradients(const double *score, score_t *gradients, score_t *hessians) const override
calculating first order derivative of loss function
Definition rank_objective.hpp:70

LightGBM::LambdarankNDCG::NeedAccuratePrediction
bool NeedAccuratePrediction() const override
The prediction should be accurate or not. True will disable early stopping for prediction.
Definition rank_objective.hpp:206

LightGBM::Metadata
This class is used to store some meta(non-feature) data for training data, e.g. labels,...
Definition dataset.h:36

LightGBM::Metadata::label
const label_t * label() const
Get pointer of label.
Definition dataset.h:113

LightGBM::Metadata::query_boundaries
const data_size_t * query_boundaries() const
Get data boundaries on queries, if not exists, will return nullptr we assume data will order by query...
Definition dataset.h:161

LightGBM::Metadata::weights
const label_t * weights() const
Get weights, if not exists, will return nullptr.
Definition dataset.h:146

LightGBM::Metadata::num_queries
data_size_t num_queries() const
Get Number of queries.
Definition dataset.h:173

LightGBM::ObjectiveFunction
The interface of Objective Function.
Definition objective_function.h:13

LightGBM
desc and descl2 fields must be written in reStructuredText format
Definition application.h:10

LightGBM::score_t
float score_t
Type of score, and gradients.
Definition meta.h:26

LightGBM::label_t
float label_t
Type of metadata, include weight and label.
Definition meta.h:33

LightGBM::data_size_t
int32_t data_size_t
Type of data size, it is better to use signed type.
Definition meta.h:14

LightGBM::Config
Definition config.h:27