kloessner/probfd/verification__impl_8h_source.html

#ifndef GUARD_INCLUDE_PROBFD_ABSTRACTIONS_VERIFICATION_H

#error "This file should only be included from verification.h"

#endif


#include "probfd/pdbs/projection_operator.h"

#include "probfd/pdbs/projection_state_space.h"


#include "probfd/evaluator.h"


#include "downward/lp/lp_solver.h"


#include <cmath>

#include <ranges>


namespace probfd {


template <typename State, typename Action>


void verify(

    MDP<State, Action>& mdp,

    std::span<const value_t> value_table,

    lp::LPSolverType type)

{

    lp::LPSolver solver(type);

    const double inf = solver.get_infinity();


    named_vector::NamedVector<lp::LPVariable> variables;

    named_vector::NamedVector<lp::LPConstraint> constraints;


    const std::size_t num_states = value_table.size();


    for (std::size_t i = 0; i != num_states; ++i) {

        const State state = mdp.get_state(i);

        const auto term_info = mdp.get_termination_info(state);

        const value_t term_cost = term_info.get_cost();


        const auto value = value_table[i];


        variables.emplace_back(

            -inf,

            std::min(term_cost, inf),

            value != INFINITE_VALUE && !std::isnan(value) ? 1_vt : 0_vt);


        // Generate operators...

        std::vector<Action> aops;

        mdp.generate_applicable_actions(i, aops);


        // Push successors

        for (const Action& op : aops) {

            const value_t cost = mdp.get_action_cost(op);


            Distribution<StateID> successor_dist;

            mdp.generate_action_transitions(i, op, successor_dist);


            if (successor_dist.is_dirac(i)) {

                continue;

            }


            auto& constr = constraints.emplace_back(-inf, cost);


            value_t non_loop_prob = 0_vt;

            for (const auto& [succ, prob] : successor_dist) {

                if (succ != static_cast<size_t>(i)) {

                    non_loop_prob += prob;

                    constr.insert(succ.id, -prob);

                }

            }


            constr.insert(i, non_loop_prob);

        }

    }


    solver.load_problem(lp::LinearProgram(

        lp::LPObjectiveSense::MAXIMIZE,

        std::move(variables),

        std::move(constraints),

        inf));


    solver.solve();


    if (!solver.has_optimal_solution()) {

        if (solver.is_infeasible()) {

            std::cerr << "Critical error: LP was infeasible!" << std::endl;

        } else {

            assert(solver.is_unbounded());

            std::cerr << "Critical error: LP was unbounded!" << std::endl;

        }


        solver.print_failure_analysis();

        abort();

    }


    std::vector<double> solution = solver.extract_solution();


    for (StateID s = 0; s.id != num_states; ++s.id) {

        const auto value = value_table[s];

        if (value != INFINITE_VALUE && !std::isnan(value)) {

            assert(is_approx_equal(value, solution[s], 0.001));

        }

    }

}


} // namespace probfd

probfd::CostFunction::get_action_cost
virtual value_t get_action_cost(param_type< Action > action)=0
Gets the cost of an action.

probfd::CostFunction::get_termination_info
virtual TerminationInfo get_termination_info(param_type< State > state)=0
Returns the cost to terminate in a given state and checks whether a state is a goal.

probfd::Distribution
A convenience class that represents a finite probability distribution.
Definition task_state_space.h:27

probfd::Distribution::is_dirac
bool is_dirac(const T &t) const
Checks if the distribution is a Dirac distribution wrt an element.
Definition distribution.h:267

probfd::MDP
Basic interface for MDPs.
Definition mdp_algorithm.h:14

probfd::StateSpace::get_state
virtual State get_state(StateID state_id)=0
Get the state mapped to a given state ID.

probfd::StateSpace::generate_applicable_actions
virtual void generate_applicable_actions(param_type< State > state, std::vector< Action > &result)=0
Generates the applicable actions of the state.

probfd::StateSpace::generate_action_transitions
virtual void generate_action_transitions(param_type< State > state, param_type< Action > action, Distribution< StateID > &result)=0
Generates the successor distribution for a given state and action.

probfd::TerminationInfo::get_cost
value_t get_cost() const
Obtains the cost paid upon termination in the state.
Definition cost_function.h:41

probfd
The top-level namespace of probabilistic Fast Downward.
Definition command_line.h:8

probfd::value_t
double value_t
Typedef for the state value type.
Definition aliases.h:7

probfd::verify
void verify(MDP< State, Action > &mdp, std::span< const value_t > value_table, lp::LPSolverType type)
Computes the optimal value function of the abstraction, complete up to forward reachability from the ...
Definition verification_impl.h:18

probfd::is_approx_equal
bool is_approx_equal(value_t v1, value_t v2, value_t epsilon=g_epsilon)
Equivalent to .

probfd::StateID
A StateID represents a state within a StateIDMap. Just like Fast Downward's StateID type,...
Definition types.h:22