Published

January 23, 2023

Reference

https://en.wikibooks.org/wiki/LaTeX/Mathematics

Examples

We can integrate markdown between $ $ or $$ $$

Single $ will be inline

Double $$ will be centered into a new line

LaTeX	Markdow
$\hat{q}$	`\widehat{q}`
$\| x - x_{M} \|$	`\|x-x_M\|`
$f_{M} (x)$	`f_M(x)`
$\sum_{m}$	`\displaystyle\sum_{m}`
$⟨ x, w_{m} ⟩$	`\langle{x,w_m}\rangle`
$∥ v_{m} ∥$	`\\| v_m \\|`
$\cos$	`\cos`
$Z^{d}$	`\mathbb{Z}$^d`
$\infty$	`\infty`
$f \in L^{2}$	`f \in L^2`
$$	`\implies`
$lim_{M \to \infty}$	`\lim\limits_{M \to \infty}`
$P (A \| B) = \frac{P (B \| A) * P (A)}{P (B)}$	`P(A\|B) = \frac{P(B\|A)*P(A)}{P(B)}`
$\begin{aligned} Q_{t} (a) & = \frac{sum of rewards when a taken prior to t}{number of times a taken prior to t} \\ = \frac{\sum_{i = 1}^{t - 1} R_{i} . 1_{A_{i} = a}}{\sum_{i = 1}^{t - 1} 1_{A_{i} = a}} \end{aligned}$	`\begin{align} \\` `Q_t(a) &= \frac{\text{sum of rewards when } \mathit{a} \text{ taken prior to }\mathit{t}}{\text{number of times } \mathit{a} \text{ taken prior to }\mathit{t}} \\` `& = \frac{\displaystyle\sum_{i=1}^{t-1} R_i.\mathcal{1}_{A_i=a}}{\displaystyle\sum_{i=1}^{t-1} \mathcal{1}_{A_i=a}}` `\end{align}`
$A_{t} = \underset{a}{argmax} Q_{t} (a)$	`A_t=\underset{a}{\mathrm{argmax}}{\text{ }Q_t(a)}`
$p (s^{'}, r \| s, a) ≐ P r {S_{t} = s^{'}, R_{t} = r \| S_{t - 1} = s, A_{t - 1} = a}$	`p(s',r\|s,a) \doteq Pr\{S_t=s', R_t=r\|S_{t-1}=s, A_{t-1}=a\}`
$q_{π} (s, a) ≐ E [R_{t + 1} + γ . G_{t + 1} \| S_{t} = s, A_{t} = a]$	`q_\pi(s,a) \doteq \mathbb{E}[R_{t+1}+\gamma.G_{t+1}\|S_t=s, A_t=a]`
$v_{*} (s) ≐ max_{π} v_{π} (s), \forall s \in S$	`v_*(s)\doteq \max\limits_{\pi} v_\pi(s), \forall s \in S`
$q_{π} (s, a) ≐ E [R_{t + 1} + γ . G_{t + 1} \| S_{t} = s, A_{t} = a]$	`q_\pi(s,a) \doteq \mathbb{E}[R_{t+1}+\gamma.G_{t+1}\|S_t=s, A_t=a]`
$l (w, b) = \frac{1}{N} \sum_{n = 1}^{N} (y_{n} - (x_{n} w + b))^{2}$	`l(w,b)=\frac{1}{N}\displaystyle\sum_{n=1}^{N}(y_n-(x_nw+b))^2`
$\nabla l (w, b) = [\begin{matrix} \frac{\partial l (w, b)}{\partial w_{1}} \\ ⋮ \\ \frac{\partial l (w, b)}{\partial w_{d}} \end{matrix}]$	`\nabla l(w,b) = \begin{bmatrix}\frac{\partial l(w,b)}{\partial w_1}\\ \vdots \\\frac{\partial l(w,b)}{\partial w_d}\end{bmatrix}`
$H (X) = - \sum_{x \in X} P (x) * \log (P (x))$	`\\ H(X) = – \sum_{x \in X} P(x) * \log(P(x))`
$X \sim N (μ, σ^{2})$	`X \sim \mathcal{N}(\mu,\,\sigma^{2})`
$\sqrt[n]{1 + x + x^{2} + x^{3} + \dots + x^{n}}$	`\sqrt[n]{1+x+x^2+x^3+\dots+x^n}`