Trevor Darrell

researcher

— at UC Berkeley

USA

Computer Vision. UC Berkeley.

@trevordarrell OpenAlex

45 papers found

In-Context Learning Enables Robot Action Prediction in LLMs

20253 citations

DOI OpenAlex

Compositional Chain-of-Thought Prompting for Large Multimodal Models

202447 citations

DOI OpenAlex

Neural Network Diffusion

arXiv (Cornell University)20242 citations

DOI arXiv OpenAlex

Self-Correcting LLM-Controlled Diffusion Models

202414 citations

DOI OpenAlex

When Do We Not Need Larger Vision Models?

Lecture notes in computer science202411 citations

DOI OpenAlex

VideoCutLER: Surprisingly Simple Unsupervised Video Instance Segmentation

202411 citations

DOI OpenAlex

Real-world humanoid locomotion with reinforcement learning

Science Robotics2024117 citations

DOI OpenAlex

See, Say, and Segment: Teaching LMMs to Overcome False Premises

20244 citations

DOI OpenAlex

Shape-Guided Diffusion with Inside-Outside Attention

202415 citations

DOI OpenAlex

TraveLER: A Modular Multi-LMM Agent Framework for Video Question-Answering

20244 citations

DOI OpenAlex

MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion

arXiv (Cornell University)20243 citations

DOI arXiv OpenAlex

Readout Guidance: Learning Control from Diffusion Features

20248 citations

DOI OpenAlex

ALOHa: A New Measure for Hallucination in Captioning Models

20248 citations

DOI OpenAlex

PromptonomyViT: Multi-Task Prompt Learning Improves Video Transformers using Synthetic Scene Data

20247 citations

DOI OpenAlex

Aligning Large Multimodal Models with Factually Augmented RLHF

202469 citations

DOI OpenAlex

Multitask Vision-Language Prompt Tuning

202437 citations

DOI OpenAlex

From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations

202436 citations

DOI OpenAlex

Describing Differences in Image Sets with Natural Language

20247 citations

DOI OpenAlex

PAIR Diffusion: A Comprehensive Multimodal Object-Level Image Editor

20243 citations

DOI OpenAlex

Near to Mid-term Risks and Opportunities of Open-Source Generative AI

arXiv (Cornell University)20243 citations

DOI arXiv OpenAlex

Risks and Opportunities of Open-Source Generative AI

arXiv (Cornell University)20246 citations

DOI arXiv OpenAlex

InstanceDiffusion: Instance-Level Control for Image Generation

202457 citations

DOI OpenAlex

Recursive Visual Programming

Lecture notes in computer science20242 citations

DOI OpenAlex

Unsupervised Universal Image Segmentation

202425 citations

DOI OpenAlex

PAIR-Diffusion: A Comprehensive Multimodal Object-Level Image Editor

arXiv (Cornell University)20233 citations

DOI arXiv OpenAlex

Learning and Verification of Task Structure in Instructional Videos

arXiv (Cornell University)20234 citations

DOI arXiv OpenAlex

Self-correcting LLM-controlled Diffusion Models

arXiv (Cornell University)20233 citations

DOI arXiv OpenAlex

LLM-grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image Diffusion Models with Large Language Models

arXiv (Cornell University)202323 citations

DOI arXiv OpenAlex

Hierarchical Open-vocabulary Universal Image Segmentation

arXiv (Cornell University)20239 citations

DOI arXiv OpenAlex

LLM-grounded Video Diffusion Models

arXiv (Cornell University)20233 citations

DOI arXiv OpenAlex

Aligning Large Multimodal Models with Factually Augmented RLHF

arXiv (Cornell University)202312 citations

DOI arXiv OpenAlex

Dropout Reduces Underfitting

arXiv (Cornell University)202316 citations

DOI arXiv OpenAlex

Scale-MAE: A Scale-Aware Masked Autoencoder for Multiscale Geospatial Representation Learning

2023144 citations

DOI OpenAlex

Diffusion Hyperfeatures: Searching Through Time and Space for Semantic Correspondence

arXiv (Cornell University)202333 citations

DOI arXiv OpenAlex

Diversify Your Vision Datasets with Automatic Diffusion-Based Augmentation

arXiv (Cornell University)202314 citations

DOI arXiv OpenAlex

QDTrack: Quasi-Dense Similarity Learning for Appearance-Only Multiple Object Tracking

IEEE Transactions on Pattern Analysis and Machine Intelligence2023102 citations

DOI OpenAlex

Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models

arXiv (Cornell University)202320 citations

DOI arXiv OpenAlex

Revisiting Generalizability in Deepfake Detection: Improving Metrics and Stabilizing Transfer

20238 citations

DOI OpenAlex

Back to the Source: Diffusion-Driven Adaptation to Test-Time Corruption

202348 citations

DOI OpenAlex

Top-Down Visual Attention from Analysis by Synthesis

202334 citations

DOI OpenAlex

Large Language Models are Visual Reasoning Coordinators

arXiv (Cornell University)202314 citations

DOI arXiv OpenAlex

Fast Image-based Neural Relighting with Translucency-Reflection Modeling

arXiv (Cornell University)20234 citations

DOI arXiv OpenAlex

Can Language Models Learn to Listen?

202320 citations

DOI OpenAlex

TOAST: Transfer Learning via Attention Steering

arXiv (Cornell University)20235 citations

DOI arXiv OpenAlex

Compositional Chain-of-Thought Prompting for Large Multimodal Models

arXiv (Cornell University)20234 citations

DOI arXiv OpenAlex