Nested Classes
Modifier and Type	Class	Description
`public class`	`RlTDAgentGeneral.Companion`

Fields
Modifier and Type	Field	Description
`public final static RlTDAgentGeneral.Companion`	`Companion`

Constructors
Constructor	Description
`RlTDAgentGeneral(Double lr, Double epsilon, Double epsDecay)`

Enum Constants
Enum Constant	Description

Modifier and Type	Method	Description
`final Unit`	`reset(RlEnvGeneral env)`	Reset the agent and environment to initial state
`final Array<DoubleArray>`	`getValueFunction()`	Get the current value function
`final Array<DoubleArray>`	`solveForFixedPolicy(RlEnvGeneral env, Integer numEpisodes)`	TD learning for value function with fixed heuristic routing policy
`final Array<DoubleArray>`	`solve(RlEnvGeneral env, Integer numEpisodes)`	TD Control with tabular value function
`final Pair<Array<DoubleArray>, DoubleArray>`	`solveByHashmap(RlEnvGeneral env, Integer numEpisodes)`	TD Control using HashMap value function
`final Triple<Array<DoubleArray>, DoubleArray, DoubleArray>`	`solveByLinear(RlEnvGeneral env, Integer numEpisodes)`	TD control using linear value function approximator
`final Triple<Array<DoubleArray>, DoubleArray, DoubleArray>`	`solveByQuad(RlEnvGeneral env, Integer numEpisodes)`	TD control using quadratic value function approximator

Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait

RlTDAgentGeneral(Double lr, Double epsilon, Double epsDecay)

reset
```
 final Unit reset(RlEnvGeneral env)
```
Reset the agent and environment to initial state

 final Array<DoubleArray> getValueFunction()

Get the current value function

 final Array<DoubleArray> solveForFixedPolicy(RlEnvGeneral env, Integer numEpisodes)

TD learning for value function with fixed heuristic routing policy

 final Array<DoubleArray> solve(RlEnvGeneral env, Integer numEpisodes)

TD Control with tabular value function

 final Pair<Array<DoubleArray>, DoubleArray> solveByHashmap(RlEnvGeneral env, Integer numEpisodes)

TD Control using HashMap value function

 final Triple<Array<DoubleArray>, DoubleArray, DoubleArray> solveByLinear(RlEnvGeneral env, Integer numEpisodes)

TD control using linear value function approximator

 final Triple<Array<DoubleArray>, DoubleArray, DoubleArray> solveByQuad(RlEnvGeneral env, Integer numEpisodes)

TD control using quadratic value function approximator

Class RlTDAgentGeneral