Yarin Gal

researcher

— at University of Oxford

Europe

Uncertainty / Bayesian DL. University of Oxford.

@yaringal OpenAlex

50 papers found

Hybrid Physics-Machine Learning Models for Quantitative Electron Diffraction Refinements

arXiv (Cornell University)2025

DOI arXiv OpenAlex

Author Correction: AI models collapse when trained on recursively generated data

Nature20252 citations

DOI OpenAlex

A Definition of AGI

arXiv (Cornell University)2025

DOI arXiv OpenAlex

Iterative Deployment Improves Planning Skills in LLMs

ArXiv.org2025

OpenAlex

Measuring large language model uncertainty in women's health using semantic entropy and perplexity: a comparative study

The Lancet Obstetrics Gynaecology & Women s Health2025

DOI OpenAlex

Scaling Up Active Testing to Large Language Models

ArXiv.org2025

DOI arXiv OpenAlex

Sampling Protein Language Models for Functional Protein Design

20251 citations

DOI OpenAlex

Customizable AI systems that anyone can adapt bring big opportunities — and even bigger risks

Nature20251 citations

DOI OpenAlex

Language Models Change Facts Based on the Way You Talk

ArXiv.org20251 citations

OpenAlex

Detecting LLM Hallucination Through Layer-wise Information Deficiency: Analysis of Ambiguous Prompts and Unanswerable Questions

20251 citations

DOI OpenAlex

FindingDory: A Benchmark to Evaluate Memory in Embodied Agents

arXiv (Cornell University)2025

DOI arXiv OpenAlex

Uncertainty-Aware Step-wise Verification with Generative Reward Models

arXiv (Cornell University)20251 citations

DOI arXiv OpenAlex

ToolTweak: An Attack on Tool Selection in LLM-based Agents

arXiv (Cornell University)2025

DOI arXiv OpenAlex

Stabilizing Policy Gradients for Sample-Efficient Reinforcement Learning in LLM Reasoning

arXiv (Cornell University)2025

DOI arXiv OpenAlex

Measuring what Matters: Construct Validity in Large Language Model Benchmarks

arXiv (Cornell University)2025

DOI arXiv OpenAlex

The human factor in explainable artificial intelligence: clinician variability in trust, reliance, and performance

npj Digital Medicine20253 citations

DOI OpenAlex

Protriever: End-to-End Differentiable Protein Homology Search for Fitness Prediction

arXiv (Cornell University)2025

DOI arXiv OpenAlex

Accelerating Long-period Exoplanet Discovery by Combining Deep Learning and Citizen Science

The Astronomical Journal2025

DOI OpenAlex

Detecting hallucinations in large language models using semantic entropy

Nature2024419 citations

DOI OpenAlex

Variational Inference Failures Under Model Symmetries: Permutation Invariant Posteriors for Bayesian Neural Networks

arXiv (Cornell University)2024

DOI arXiv OpenAlex

TextCAVs: Debugging vision models using text

arXiv (Cornell University)2024

DOI arXiv OpenAlex

Estimating the Hallucination Rate of Generative AI

arXiv (Cornell University)20244 citations

DOI arXiv OpenAlex

AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents

arXiv (Cornell University)20244 citations

DOI arXiv OpenAlex

Pre-trained Text-to-Image Diffusion Models Are Versatile Representation Learners for Control

arXiv (Cornell University)2024

DOI arXiv OpenAlex

Physically Motivated Deep Learning to Superresolve and Cross Calibrate Solar Magnetograms

The Astrophysical Journal Supplement Series20247 citations

DOI OpenAlex

AI models collapse when trained on recursively generated data

Nature2024410 citations

DOI OpenAlex

Semantic Entropy Probes: Robust and Cheap Hallucination Detection in LLMs

arXiv (Cornell University)20242 citations

DOI arXiv OpenAlex

Estimating the Hallucination Rate of Generative AI

20241 citations

DOI OpenAlex

Challenges and Considerations in the Evaluation of Bayesian Causal Discovery

arXiv (Cornell University)20241 citations

DOI arXiv OpenAlex

Machine learning for functional protein design

Nature Biotechnology2024205 citations

DOI OpenAlex

Fine-Tuning Large Language Models to Appropriately Abstain with Semantic Entropy

arXiv (Cornell University)20241 citations

DOI arXiv OpenAlex

Kernel Language Entropy: Fine-grained Uncertainty Quantification for LLMs from Semantic Similarities

arXiv (Cornell University)20242 citations

DOI arXiv OpenAlex

Pre-trained Text-to-Image Diffusion Models Are Versatile Representation Learners for Control

2024

DOI OpenAlex

Explaining Explainability: Recommendations for Effective Use of Concept Activation Vectors

arXiv (Cornell University)20241 citations

DOI arXiv OpenAlex

Deep Bayesian Active Learning for Preference Modeling in Large Language Models

arXiv (Cornell University)20241 citations

DOI arXiv OpenAlex

Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation

arXiv (Cornell University)202348 citations

DOI arXiv OpenAlex

Prediction-Oriented Bayesian Active Learning

arXiv (Cornell University)20237 citations

DOI arXiv OpenAlex

ProteinNPT: Improving Protein Property Prediction and Design with Non-Parametric Transformers

202321 citations

DOI OpenAlex

Can Active Sampling Reduce Causal Confusion in Offline Reinforcement Learning?

arXiv (Cornell University)20231 citations

DOI arXiv OpenAlex

In-Context Learning Learns Label Relationships but Is Not Conventional Learning

arXiv (Cornell University)20234 citations

DOI arXiv OpenAlex

Continual Learning via Sequential Function-Space Variational Inference

arXiv (Cornell University)20235 citations

DOI arXiv OpenAlex

Tractable Function-Space Variational Inference in Bayesian Neural Networks

arXiv (Cornell University)20236 citations

DOI arXiv OpenAlex

ReLU to the Rescue: Improve Your On-Policy Actor-Critic with Positive Advantages

arXiv (Cornell University)20232 citations

DOI arXiv OpenAlex

Precipitation-Triggered Landslide Prediction in Nepal Using Machine Learning and Deep Learning

20236 citations

DOI OpenAlex

DiscoBAX: Discovery of Optimal Intervention Sets in Genomic Experiment Design

arXiv (Cornell University)20233 citations

DOI arXiv OpenAlex

Learning from prepandemic data to forecast viral escape

Nature2023150 citations

DOI OpenAlex

Fine-tuning can cripple your foundation model; preserving features may be the solution

arXiv (Cornell University)20231 citations

DOI arXiv OpenAlex

LLM Censorship: A Machine Learning Challenge or a Computer Security Problem?

arXiv (Cornell University)202319 citations

DOI arXiv OpenAlex

How to Catch an AI Liar: Lie Detection in Black-Box LLMs by Asking Unrelated Questions

arXiv (Cornell University)20236 citations

DOI arXiv OpenAlex

BatchGFN: Generative Flow Networks for Batch Active Learning

arXiv (Cornell University)2023

DOI arXiv OpenAlex