Graham Neubig

researcher

— at Carnegie Mellon University

USA

NLP. Carnegie Mellon University.

@gneubig OpenAlex

30 papers found

CodeRAG-Bench: Can Retrieval Augment Code Generation?

20259 citations

DOI OpenAlex

CowPilot: A Framework for Autonomous and Human-Agent Collaborative Web Navigation

20254 citations

DOI OpenAlex

What Are Tools Anyway? A Survey from the Language Model Perspective

arXiv (Cornell University)20244 citations

DOI arXiv OpenAlex

Fine-grained Hallucination Detection and Editing for Language Models

arXiv (Cornell University)20248 citations

DOI arXiv OpenAlex

In-Context Learning with Long-Context Models: An In-Depth Exploration

arXiv (Cornell University)20247 citations

DOI arXiv OpenAlex

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

202429 citations

DOI OpenAlex

VisualWebArena: Evaluating Multimodal Agents on Realistic Visual Web Tasks

202417 citations

DOI OpenAlex

Everybody Prune Now: Structured Pruning of LLMs with only Forward Passes

arXiv (Cornell University)20246 citations

DOI arXiv OpenAlex

Better Synthetic Data by Retrieving and Transforming Existing Datasets

202410 citations

DOI OpenAlex

Instruction-tuned Language Models are Better Knowledge Learners

20249 citations

DOI OpenAlex

NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples

arXiv (Cornell University)20243 citations

DOI arXiv OpenAlex

Large Language Models Enable Few-Shot Clustering

Transactions of the Association for Computational Linguistics202444 citations

DOI OpenAlex

An Incomplete Loop: Instruction Inference, Instruction Following, and In-context Learning in Language Models

arXiv (Cornell University)20243 citations

DOI arXiv OpenAlex

Evaluating and Improving Compositional Text-to-Visual Generation

202420 citations

DOI OpenAlex

Do LLMs Exhibit Human-like Response Biases? A Case Study in Survey Design

Transactions of the Association for Computational Linguistics202447 citations

DOI OpenAlex

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

arXiv (Cornell University)20246 citations

DOI arXiv OpenAlex

Evaluating Text-to-Visual Generation with Image-to-Text Generation

Lecture notes in computer science202435 citations

DOI OpenAlex

An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance

20246 citations

DOI OpenAlex

Learning to Filter Context for Retrieval-Augmented Generation

arXiv (Cornell University)20238 citations

DOI arXiv OpenAlex

Do LLMs exhibit human-like response biases? A case study in survey design

arXiv (Cornell University)20235 citations

DOI arXiv OpenAlex

FacTool: Factuality Detection in Generative AI -- A Tool Augmented Framework for Multi-Task and Multi-Domain Scenarios

arXiv (Cornell University)202325 citations

DOI arXiv OpenAlex

EXCALIBUR: Encouraging and Evaluating Embodied Exploration

20236 citations

DOI OpenAlex

An In-depth Look at Gemini's Language Abilities

arXiv (Cornell University)202311 citations

DOI arXiv OpenAlex

Unlimiformer: Long-Range Transformers with Unlimited Length Input

arXiv (Cornell University)202323 citations

DOI arXiv OpenAlex

ChatGPT MT: Competitive for High- (but not Low-) Resource Languages

arXiv (Cornell University)20235 citations

DOI arXiv OpenAlex

Active Retrieval Augmented Generation

arXiv (Cornell University)202317 citations

DOI arXiv OpenAlex

SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents

arXiv (Cornell University)20233 citations

DOI arXiv OpenAlex

Computational Language Acquisition with Theory of Mind

arXiv (Cornell University)20235 citations

DOI arXiv OpenAlex

Large Language Models Enable Few-Shot Clustering

arXiv (Cornell University)20234 citations

DOI arXiv OpenAlex

Multi-Dimensional Evaluation of Text Summarization with In-Context Learning

arXiv (Cornell University)20235 citations

DOI arXiv OpenAlex