Blogs & technical notes

Blogs & technical notes

Learning Reinforcement Learning
November-2025 (in progress)
Notes on modern deep RL: policy gradients, actor–critic methods, Q-learning, exploration and practical training insights from UC Berkley’s CS285
JAX: Jit Autograd XLA
October-2025
In-depth reference on JAX: design and programming philosophy, distributed / multi-device training, async dispatch via XLA and high-performance usage patterns
Mechanistic Interpretability
August-2025
An overview of techniques for reverse-engineering features, circuits, and representations in vision models using probing, disentanglement, and adversarial analysis
Generative Adversarial Networks
July-2025
A concise exploration of how GANs work focusing on training schemes, architectures, objectives and the Generator-Discriminator dynamics