LREC 2022: Program

LREC 2022 Program - Day 1 Oral & Poster Sessions

Tuesday, 21 June 2022

Day 1

09:30 - 11:00

Opening Ceremony
[Video]
Address by the LREC Chair, Nicoletta Calzolari
Address by the ELRA President, António Branco
Address by the ELRA Secretary General, Khalid Choukri
Address by the LREC Committee Chairs, Frédéric Béchet and Philippe Blache

11:00 - 11:20

ELRA: Next 25 Years
[Video]

11:20 - 11:40

Coffee Break

11:40 - 13:00

Session O1: Machine Translation and Evaluation - Auditorium
Chair: Macken, Lieve
Co-Chair: Basta, Christine

11:40 - 12:00

Domain Adaptation in Neural Machine Translation using a Qualia-Enriched FrameNet
[Paper] [Slides] [Video]
Alexandre Diniz da Costa¹, Mateus Coutinho Marim², Ely Matos¹, Tiago Timponi Torrent²
¹UFJF - Federal University of Juiz de Fora, ²Federal University of Juiz de Fora

12:00 - 12:20

HOPE: A Task-Oriented and Human-Centric Evaluation Framework Using Professional Post-Editing Towards More Effective MT Evaluation
[Paper] [Slides] [Video]
Serge Gladkoff¹ and Lifeng Han²
¹Logrus Global, ²Dublin City University

12:20 - 12:40

Priming Ancient Korean Neural Machine Translation
[Paper] [Slides] [Video]
chanjun park¹, Seolhwa Lee², Jaehyung Seo¹, Hyeonseok Moon³, Sugyeong Eo¹, Heuiseok Lim¹
¹korea university, ²University of Copenhagen, ³glee889@korea.ac.kr

12:40 - 13:00

GECO-MT: The Ghent Eye-tracking Corpus of Machine Translation
[Paper] [Slides] [Video]
Toon Colman, Margot Fonteyne, Joke Daems, Nicolas Dirix, Lieve Macken
Ghent University

11:40 - 13:00

Session O2: Semantics and Lexicon - Salle 120
Chair: Krek, Simon
Co-Chair: Cruz González, Rafael

11:40 - 12:00

Introducing Frege to Fillmore: A FrameNet Dataset that Captures both Sense and Reference
[Paper] [Slides] [Video]
Levi Remijnse¹, Piek Vossen², Antske Fokkens³, Sam Titarsolej³
¹Vrije Universiteit, ²VU University Amsterdam, ³VU Amsterdam

12:00 - 12:20

Compiling a Suitable Level of Sense Granularity in a Lexicon for AI Purposes: The Open Source COR Lexicon
[Paper] [Slides] [Video]
Bolette Pedersen¹, Nathalie Sørensen¹, Sanni Nimb², Ida Flørke³, Sussi Olsen⁴, Thomas Troelsgård⁵
¹University of Copenhagen, ²Society for Danish Language and Literature (DSL), ³The Danish Society for Language and Literature, ⁴UCPH, Centre for Language Technology, ⁵Society for Danish Language and Literature

12:20 - 12:40

Sense and Sentiment
[Paper] [Slides] [Video]
Francis Bond¹ and Merrick Choo²
¹Palacký University, ²NTU

12:40 - 13:00

Enriching Linguistic Representation in the Cantonese Wordnet and Building the New Cantonese Wordnet Corpus
[Paper] [Slides] [Video]
Ut Seong Sio¹ and Luís Morgado da Costa²
¹Nanyang Technological University, ²Palacký University

11:40 - 13:00

Session O3: Corpus and Annotation (1) - La Major
Chair: Fišer, Darja
Co-Chair: Chersoni, Emmanuele

11:40 - 12:00

ZAEBUC: An Annotated Arabic-English Bilingual Writer Corpus
[Paper] [Slides] [Video]
Nizar Habash¹ and David Palfreyman²
¹New York University Abu Dhabi, ²Zayed University

12:00 - 12:20

Turkish Universal Conceptual Cognitive Annotation
[Paper] [Slides] [Video]
Necva Bölücü¹ and Burcu Can²
¹Hacettepe University, ²Wolverhampton UK

12:20 - 12:40

Introducing the CURLICAT Corpora: Seven-language Domain Specific Annotated Corpora from Curated Sources
[Paper] [Video]
Tamás Váradi¹, Bence Nyéki¹, Svetla Koeva², Marko Tadić³, Vanja Štefanec⁴, Maciej Ogrodniczuk⁵, Bartłomiej Nitoń⁵, Piotr Pęzik⁶, Verginica Barbu Mititelu⁷, Elena Irimia⁷, Maria Mitrofan⁷, Dan Tufiș⁷, Radovan Garabík⁸, Simon Krek⁹, Andraž Repar⁹
¹Hungarian Research Centre for Linguistics, Budapest, ²Institute for Bulgarian Language, Bulgarian Academy of Sciences, Sofia, ³University of Zagreb, Faculty of Humanities and Social Sciences, ⁴University of Zagreb, Faculty of Humanities and Social Sciences, Zagreb, ⁵Institute of Computer Science, Polish Academy of Sciences, Warsaw, ⁶University of Łódź, Łódź, ⁷RACAI, Bucharest, ⁸Ľ. Štúr Institute of Linguistics, Slovak Academy of Sciences, Bratislava, ⁹IJS, Ljubljana

12:40 - 13:00

RU-ADEPT: Russian Anonymized Dataset with Eight Personality Traits
[Paper] [Slides] [Video]
C. Anton Rytting¹, Valerie Novak¹, James Hull¹, Victor Frank¹, Paul Rodrigues², Jarrett Lee¹, Laurel Miller-Sims³
¹University of Maryland College Park, ²Accenture, ³University of Maryland

11:40 - 13:00

Session O4: Dialogue (1) - Salle 92
Chair: Navarretta, Costanza
Co-Chair: Higashinaka, Ryuichiro

11:40 - 12:00

CoQAR: Question Rewriting on CoQA
[Paper] [Video]
Quentin Brabant¹, Gwénolé Lecorvé², Lina M. Rojas Barahona³
¹Orange Innovation, ²Orange, ³Orange Labs

12:00 - 12:20

User Interest Modelling in Argumentative Dialogue Systems
[Paper] [Video]
Annalena Aicher¹, Nadine Gerstenlauer¹, Wolfgang Minker¹, Stefan Ultes²
¹Ulm University, ²Mercedes-Benz AG

12:20 - 12:40

Every time I fire a conversational designer, the performance of the dialogue system goes down
[Paper] [Video]
Giancarlo Xompero¹, Michele Mastromattei², Samir Salman³, Cristina Giannone⁴, Andrea Favalli⁵, Raniero Romagnoli⁵, Fabio Massimo Zanzotto²
¹Almawave SpA, ²University of Rome Tor Vergata, ³University of Rome "Tor Vergata", ⁴Almawave srl, ⁵Almawave

12:40 - 13:00

An Empirical Study on the Overlapping Problem of Open-Domain Dialogue Datasets
[Paper] [Slides] [Video]
Yuqiao Wen, Guoqing Luo, Lili Mou
University of Alberta

11:40 - 13:00

Session: P1 - Language Resource Infrastructures and Policy issues - Poster Area 1
Chair: Labropoulou, Penny

Language Technologies for the Creation of Multilingual Terminologies. Lessons Learned from the SSHOC Project
[Paper] [Video]
Federica Gamba¹, Francesca Frontini², Daan Broeder³, Monica Monachini⁴
¹Istituto di Linguistica Computazionale “A. Zampolli” (ILC-CNR), ²Istituto di Linguistica Computazionale "A. Zampolli" - ILC Consiglio Nazionale delle Ricerche - CNR, ³CLARIN ERIC, ⁴Institute of Computational Linguistics "A. Zampolli" - CNR

How to be FAIR when you CARE: The DGS Corpus as a Case Study of Open Science Resources for Minority Languages
[Paper] [Video]
Marc Schulder and Thomas Hanke
University of Hamburg

Italian NLP for Everyone: Resources and Models from EVALITA to the European Language Grid
[Paper] [Poster] [Video]
Valerio Basile¹, Cristina Bosco², Michael Fell¹, Viviana Patti³, Rossella Varvara⁴
¹University of Turin, ²Dipartimento di Informatica - Università di Torino, ³University of Turin, Dipartimento di Informatica, ⁴University of Fribourg

Cross-Lingual Link Discovery for Under-Resourced Languages
[Paper] [Poster] [Video]
Michael Rosner¹, Sina Ahmadi², Elena-Simona Apostol³, Julia Bosque-Gil⁴, Christian Chiarcos⁵, Milan Dojchinovski⁶, Katerina Gkirtzou⁷, Jorge Gracia⁴, Dagmar Gromann⁸, Chaya Liebeskind⁹, Giedrė Valūnaitė Oleškevičienė¹⁰, Gilles Sérasset¹¹, Ciprian-Octavian Truică¹²
¹University of Malta, ²NUI, Galway, ³University Politehnica of Bucharest, Romania, ⁴University of Zaragoza, ⁵Goethe-Universität Frankfurt am Main, ⁶CTU in Prague / InfAI, Germany, ⁷ILSP/Athena Research Center, ⁸University of Vienna, ⁹Jerusalem College of Technology , Lev Academic Center, ¹⁰Mykolas Romeris University, ¹¹Université Grenoble Alpes, ¹²Uppsala University

11:40 - 13:00

Session: P2 - Social Media Processing - Poster Area 1
Chair: Parde, Natalie

Angry or Sad ? Emotion Annotation for Extremist Content Characterisation
[Paper] [Video]
Valentina Dragos¹, Delphine Battistelli², Aline Etienne², Yolène Constable¹
¹ONERA, ²MODYCO

Identification of Multiword Expressions in Tweets for Hate Speech Detection
[Paper] [Video]
Nicolas Zampieri¹, Carlos Ramisch², Irina Illina³, Dominique Fohr¹
¹LORIA-INRIA, ²Aix Marseille University, CNRS, LIS, ³LORIA/INRIA

Causal Investigation of Public Opinion during the COVID-19 Pandemic via Social Media Text
[Paper] [Poster] [Video]
Michael Jantscher and Roman Kern
Graz University of Technology

Misspelling Semantics in Thai
[Paper] [Poster] [Video]
Pakawat Nakwijit and Matthew Purver
Queen Mary University of London

Automatic Detection of Stigmatizing Uses of Psychiatric Terms on Twitter
[Paper] [Video]
Véronique MORICEAU¹, Farah Benamara², Abdelmoumene Boumadane³
¹IRIT, Université Toulouse 3, ²University of toulouse, ³université Paris Saclay

CoVERT: A Corpus of Fact-checked Biomedical COVID-19 Tweets
[Paper] [Poster] [Video]
Isabelle Mohr¹, Amelie Wührl², Roman Klinger²
¹Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, ²University of Stuttgart

XLM-T: Multilingual Language Models in Twitter for Sentiment Analysis and Beyond
[Paper] [Poster] [Video]
Francesco Barbieri¹, Luis Espinosa Anke², Jose Camacho-Collados²
¹Snap Inc., ²Cardiff University

‘Am I the Bad One’? Predicting the Moral Judgement of the Crowd Using Pre–trained Language Models
[Paper] [Poster] [Video]
Areej Alhassan¹, Jinkai Zhang², Viktor Schlegel²
¹King Saud University, ²University of Manchester

11:40 - 13:00

Session: P3 - Natural Language Generation (including Summarization) (1) - Poster Area 1
Chair: Reed, Chris

Generating Questions from Wikidata Triples
[Paper] [Poster] [Video]
Kelvin Han¹, Thiago Castro Ferreira², Claire Gardent³
¹Loria/CNRS, ²Federal University of Minas Gerais, ³CNRS/LORIA

Evaluating Transformer Language Models on Arithmetic Operations Using Number Decomposition
[Paper] [Poster] [Video]
Matteo Muffo, Aldo Cocco, Enrico Bertino
Indigo.ai

Evaluating the Effects of Embedding with Speaker Identity Information in Dialogue Summarization
[Paper] [Video]
Yuji Naraki, Tetsuya Sakai, Yoshihiko Hayashi
Waseda University

Perceived Text Quality and Readability in Extractive and Abstractive Summaries
[Paper] [Poster] [Video]
Julius Monsen and Evelina Rennes
Linköping University

Learning to Prioritize: Precision-Driven Sentence Filtering for Long Text Summarization
[Paper] [Poster] [Video]
Alex Mei¹, Anisha Kabir¹, Rukmini Bapat¹, John Judge¹, Tony Sun¹, William Yang Wang²
¹University of California, Santa Barbara, ²Unversity of California, Santa Barbara

Automating Horizon Scanning in Future Studies
[Paper] [Poster] [Video]
Tatsuya Ishigaki¹, Suzuko Nishino², Sohei Washino³, Hiroki Igarashi³, Yukari Nagai², Yuichi Washida⁴, Akihiko Murai³
¹National Institute of Advanced Industrial Science and Technology (AIST), ²Japan Advanced Institute of Science and Technology, ³National Institute of Advanced Industrial Science and Technology, ⁴Hitotsubashi University

11:40 - 13:00

Session: P4 - Statistical Methods and Machine Learning (1) - Poster Area 1
Chair: Mesgar, Mohsen

ViHealthBERT: Pre-trained Language Models for Vietnamese in Health Text Mining
[Paper] [Video]
Nguyen Minh¹, Vu Tran¹, Vu Hoang¹, Huy Ta¹, Trung Bui², Steven Truong¹
¹Vinbrain, ²Vinbrain; Adobe Research

Privacy-Preserving Graph Convolutional Networks for Text Classification
[Paper] [Poster] [Video]
Timour Igamberdiev¹ and Ivan Habernal²
¹Technical University of Darmstadt, ²Technische Universität Darmstadt

ArMATH: a Dataset for Solving Arabic Math Word Problems
[Paper] [Poster] [Video]
Reem Alghamdi¹, Zhenwen Liang², Xiangliang Zhang²
¹King Abdullah University of Science and Technology (KAUST), ²University of Notre Dame

KIMERA: Injecting Domain Knowledge into Vacant Transformer Heads
[Paper] [Poster] [Video]
Benjamin Winter, Alexei Rosero, Alexander Löser, Felix Gers, Amy Siu
Berliner Hochschule für Technik

Distilling the Knowledge of Romanian BERTs Using Multiple Teachers
[Paper] [Poster] [Video]
Andrei-Marius Avram¹, Darius Catrina², Dumitru-Clementin Cercel³, Mihai Dascalu³, Traian Rebedea³, Vasile Pais¹, Dan Tufis¹
¹Research Institute for Artificial Intelligence, Romanian Academy, ²Duke University, ³University Politehnica of Bucharest

Personalized Filled-pause Generation with Group-wise Prediction Models
[Paper] [Poster] [Video]
Yuta Matsunaga, Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari
Graduate School of Information Science and Technology, The University of Tokyo

Transformer versus LSTM Language Models trained on Uncertain ASR Hypotheses in Limited Data Scenarios
[Paper] [Poster] [Video]
Imran Sheikh¹, Emmanuel Vincent², Irina Illina³
¹Vivoka, ²Inria, ³LORIA/INRIA

Out of Thin Air: Is Zero-Shot Cross-Lingual Keyword Detection Better Than Unsupervised?
[Paper] [Poster] [Video]
Boshko Koloski¹, Senja Pollak², Blaž Škrlj², Matej Martinc¹
¹Jozef Stefan Institute, ²Jožef Stefan Institute

Evaluating Pretraining Strategies for Clinical BERT Models
[Paper] [Poster] [Video]
Anastasios Lamproudis¹, Aron Henriksson², Hercules Dalianis¹
¹DSV/Stockholm University, ²Department of Computer and Systems Sciences (DSV), Stockholm University

11:40 - 13:00

Session: P5 - Information Extraction (1) - Poster Area 1
Chair: Ferret, Olivier

KazNERD: Kazakh Named Entity Recognition Dataset
[Paper] [Poster] [Video]
Rustem Yeshpanov¹, Yerbolat Khassanov², Huseyin Atakan Varol²
¹Institute of Smart Systems and Artificial Intelligence, Nazarbayev University, ²Nazarbayev University

Mitigating Dataset Artifacts in Natural Language Inference Through Automatic Contextual Data Augmentation and Learning Optimization
[Paper] [Poster] [Video]
Michail Mersinias and Panagiotis Valvis
University of Texas at Austin

Kompetencer: Fine-grained Skill Classification in Danish Job Postings via Distant Supervision and Transfer Learning
[Paper] [Poster] [Video]
Mike Zhang¹, Kristian Nørgaard Jensen¹, Barbara Plank²
¹IT University of Copenhagen, ²LMU Munich

Semantic Role Labelling for Dutch Law Texts
[Paper] [Poster] [Video]
Roos Bakker¹, Romy van Drie¹, Maaike de Boer¹, Robert van Doesburg², Tom van Engers²
¹TNO, ²TNO, Leibniz Center for Law, UvA

English Language Spelling Correction as an Information Retrieval Task Using Wikipedia Search Statistics
[Paper] [Poster] [Video]
Kyle Goslin and Markus Hofmann
TU Dublin

CrudeOilNews: An Annotated Crude Oil News Corpus for Event Extraction
[Paper] [Poster] [Video]
Meisin Lee, Lay-Ki Soon, Eu Gene Siew, Ly Fie Sugianto
Monash University

Claim Extraction and Law Matching for COVID-19-related Legislation
[Paper] [Poster] [Video]
Niklas Dehio¹, Malte Ostendorff², Georg Rehm³
¹Technical University Berlin, ²German Research Center for Artificial Intelligence, ³DFKI

Constructing A Dataset of Support and Attack Relations in Legal Arguments in Court Judgements using Linguistic Rules
[Paper] [Poster] [Video]
Basit Ali¹, Sachin Pawar², Girish Palshikar³, Rituraj Singh¹
¹TCS Research, ²Tata Consultancy Services Ltd., ³Tata Consultancy Services Limited

KIND: an Italian Multi-Domain Dataset for Named Entity Recognition
[Paper] [Poster] [Video]
Teresa Paccosi¹ and Alessio Palmero Aprosio²
¹Università degli Studi di Trento, ²Fondazione Bruno Kessler

Russian Jeopardy! Data Set for Question-Answering Systems
[Paper] [Poster] [Video]
Elena Mikhalkova and Alexander Khlyupin
Tyumen State University

Know Better – A Clickbait Resolving Challenge
[Paper] [Poster] [Video]
Benjamin Hättasch¹ and Carsten Binnig²
¹DM Lab, Technische Universität Darmstadt, ²TU Darmstadt

Valet: Rule-Based Information Extraction for Rapid Deployment
[Paper] [Video]
Dayne Freitag, John Cadigan, Robert Sasseen, Paul Kalmar
SRI International

Negation Detection in Dutch Spoken Human-Computer Conversations
[Paper] [Video]
Tom Sweers¹, Iris Hendrickx², Helmer Strik³
¹Centre for Language and Speech Technology (CLST), Centre for Language Studies (CLS), Radboud University, Nijmegen, ²Centre for Language Studies, Radboud University Nijmegen, ³Centre for Language and Speech Technology (CLST), Centre for Language Studies (CLS), Radboud University Nijmegen

13:00 - 14:30

Lunch Break

14:30 - 15:10

Keynote Speaker: Julia Parish-Morris - Auditorium
[Video]
Chair: Cieri, Chris

15:15 - 16:35

Session O5: Language Resource Policies and Management - Auditorium
Chair: Di Persio, Denise
Co-Chair: Frontini, Francesca

15:15 - 15:35

Reflections on 30 Years of Language Resource Development and Sharing
[Paper] [Slides] [Video]
Christopher Cieri¹, Mark Liberman², Sunghye Cho¹, Stephanie Strassel¹, James Fiumara¹, Jonathan Wright²
¹Linguistic Data Consortium, University of Pennsylvania, ²University of Pennsylvania

15:35 - 15:55

Language Resources to Support Language Diversity – the ELRA Achievements
[Paper] [Slides] [Video]
Valérie Mapelli¹, Victoria Arranz¹, Khalid Choukri², Hélène Mazo¹
¹ELDA, ²ELRA/ELDA

15:55 - 16:15

Ethical Issues in Language Resources and Language Technology – Tentative Categorisation
[Paper] [Slides] [Video]
Pawel Kamocki¹ and Andreas Witt²
¹Leibniz Institute for German Language, ²Leibniz Institute for the German Language

16:15 - 16:35

Do we Name the Languages we Study? The #BenderRule in LREC and ACL articles
[Paper] [Slides] [Video]
Fanny Ducel¹, Karën Fort², Gaël Lejeune³, Yves Lepage⁴
¹Sorbonne Université, ²Sorbonne Université and LORIA, ³STIH, Paris-Sorbonne, ⁴Waseda University

15:15 - 16:35

Session O6: Emotion and Sentiment - La Major
Chair: Agerri, Rodrigo
Co-Chair: Labat, Sofie

15:15 - 15:35

Aspect-Based Emotion Analysis and Multimodal Coreference: A Case Study of Customer Comments on Adidas Instagram Posts
[Paper] [Video]
Luna De Bruyne¹, Akbar Karimi², Orphee De Clercq³, Andrea Prati², Veronique Hoste³
¹LT3, Language and Translation Technology Team, Ghent University, ²IMP Lab, University of Parma, ³LT3, Ghent University

15:35 - 15:55

Multi-source Multi-domain Sentiment Analysis with BERT-based Models
[Paper] [Slides] [Video]
Gabriel Roccabruna, Steve Azzolin, Giuseppe Riccardi
University of Trento

15:55 - 16:15

NaijaSenti: A Nigerian Twitter Sentiment Corpus for Multilingual Sentiment Analysis
[Paper] [Slides] [Video]
Shamsuddeen Muhammad¹, David Adelani², Anuoluwapo Aremu³, Idris Abdulmumin⁴
¹Faculty of computer science, University of Porto, ²Saarland University, ³Masakhane, ⁴Ahmadu Bello University, Zaria

16:15 - 16:35

A (Psycho-)Linguistically Motivated Scheme for Annotating and Exploring Emotions in a Genre-Diverse Corpus
[Paper] [Slides] [Video]
Aline Etienne¹, Delphine Battistelli¹, Gwénolé Lecorvé²
¹MoDyCo, ²Orange

15:15 - 16:35

Session O7: Knowledge Discovery and Evaluation - Salle 120
Chair: Rigau, German
Co-Chair: Vezzani, Federica

15:15 - 15:35

Integrating a Phrase Structure Corpus Grammar and a Lexical-Semantic Network: the HOLINET Knowledge Graph
[Paper] [Slides] [Video]
Jean-Philippe Prost
Aix-Marseille Université

15:35 - 15:55

On the Impact of Temporal Representations on Metaphor Detection
[Paper] [Slides] [Video]
Giorgio Ottolina¹, Matteo Palmonari¹, Manuel Vimercati¹, Mehwish Alam²
¹University of Milano-Bicocca at Milan, ²FIZ Karlsruhe - Leibniz Institute for Information Infrastructure, AIFB Institute, KIT

15:55 - 16:15

Analysis and Prediction of NLP Models via Task Embeddings
[Paper] [Slides] [Video]
Damien Sileo and Marie-Francine Moens
KU Leuven

16:15 - 16:35

Cross-lingual and Cross-domain Transfer Learning for Automatic Term Extraction from Low Resource Data
[Paper] [Slides] [Video]
Amir Hazem¹, Merieme Bouhandi², Florian Boudin³, Beatrice Daille⁴
¹LS2N UMR CNRS 6004, ²LS2N, ³Université de Nantes, ⁴Université de Nantes - LS2N

15:15 - 16:35

Session O8: Applications involving LRs and Evaluation (1) - Salle 92
Chair: Rehm, Georg
Co-Chair: ImaniGooghari, Ayyoob

15:15 - 15:35

Few-Shot Learning for Argument Aspects of the Nuclear Energy Debate
[Paper] [Slides] [Video]
Lena Jurkschat¹, Gregor Wiedemann², Maximilian Heinrich³, Mattes Ruckdeschel⁴, Sunna Torge¹
¹Technische Universität Dresden, ²Leibniz Institute for Media Research | Hans-Bredow-Institute, ³Leipzig University, Germany, ⁴Leibniz-Institute for Media Research|Hans-Bredow-Institute, Germany

15:55 - 16:15

MuLVE, A Multi-Language Vocabulary Evaluation Data Set
[Paper] [Slides] [Video]
Anik Jacobsen¹, Salar Mohtaj², Sebastian Möller³
¹TU Berlin, ²Technische Universität Berlin, ³Quality and Usability Lab, TU Berlin

16:15 - 16:35

PLOD: An Abbreviation Detection Dataset for Scientific Documents
[Paper] [Slides] [Video]
Leonardo Zilio¹, Hadeel Saadany², Prashant Sharma¹, Diptesh Kanojia¹, Constantin Orăsan¹
¹University of Surrey, ²University of Wolverhampton

15:15 - 16:35

Session: P6 - Corpora and Annotation (1) - Poster Area 2
Chair: Biemann, Chris

Potential Idiomatic Expression (PIE)-English: Corpus for Classes of Idioms
[Paper] [Poster] [Video]
Tosin Adewumi¹, Roshanak Vadoodi¹, Aparajita Tripathy¹, Konstantina Nikolaido¹, Foteini Liwicki¹, Marcus Liwicki²
¹Luleå University of Technology, ²Luleå University

LeSpell - A Multi-Lingual Benchmark Corpus of Spelling Errors to Develop Spellchecking Methods for Learner Language
[Paper] [Poster] [Video]
Marie Bexte¹, Ronja Laarmann-Quante¹, Andrea Horbach¹, Torsten Zesch²
¹FernUniversität in Hagen, ²Computational Linguistics, FernUniversität in Hagen

Subjective Text Complexity Assessment for German
[Paper] [Poster] [Video]
Laura Seiffe¹, Fares Kallel¹, Sebastian Möller², Babak Naderi³, Roland Roller⁴
¹Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI), ²Quality and Usability Lab, TU Berlin, ³Technische Universität Berlin, ⁴DFKI LT Lab

Querying Interaction Structure: Approaches to Overlap in Spoken Language Corpora
[Paper] [Poster] [Video]
Elena Frick¹, Thomas Schmidt², Henrike Helmer¹
¹Leibniz-Institute for German Language, ²IDS Mannheim

DiaBiz – an Annotated Corpus of Polish Call Center Dialogs
[Paper] [Poster] [Video]
Piotr Pęzik, Gosia Krawentek, Sylwia Karasińska, Paweł Wilk, Paulina Rybińska, Anna Cichosz, Angelika Peljak-Łapińska, Mikołaj Deckert, Michał Adamczyk
University of Lodz

LaVA – Latvian Language Learner corpus
[Paper] [Poster] [Video]
Roberts Darģis¹, Ilze Auziņa², Inga Kaija³, Kristīne Levāne-Petrova², Kristīne Pokratniece¹
¹Institute of Mathematics and Computer Science, University of Latvia, ²Institte of Mathematics and Computer Science, University of Latvia, ³Rīga Stradiņš University

The EuroPat Corpus: A Parallel Corpus of European Patent Data
[Paper] [Poster] [Video]
Kenneth Heafield¹, Elaine Farrow², Jelmer van der Linde², Gema Ramírez-Sánchez³, Dion Wiggins⁴
¹University of Edinburgh, ²School of Informatics, University of Edinburgh, ³Prompsit Language Engineering, SL (PLE), ⁴Omniscien Technologies

"Beste Grüße, Maria Meyer" — Pseudonymization of Privacy-Sensitive Information in Emails
[Paper] [Poster] [Video]
Elisabeth Eder¹, Michael Wiegand², Ulrike Krieg-Holz¹, Udo Hahn³
¹University of Klagenfurt, ²Alpen-Adria-Universitaet Klagenfurt, ³Friedrich-Schiller-Universität Jena

Criteria for the Annotation of Implicit Stereotypes
[Paper] [Video]
Wolfgang Schmeisser-Nieto¹, Montserrat Nofre¹, Mariona Taulé²
¹Universitat de Barcelona, ²University of Barcelona

Common Phone: A Multilingual Dataset for Robust Acoustic Modelling
[Paper] [Poster] [Video]
Philipp Klumpp¹, Tomas Arias², Paula Andrea Pérez-Toro³, Elmar Noeth⁴, Juan Orozco-Arroyave²
¹Friedrich-Alexander-Universität Erlangen-Nürnberg, ²Universidad de Antioquia, ³University of Erlangen-Nuremberg, ⁴Friedrich-Alexander-University Erlangen-Nuremberg

Curras + Baladi: Towards a Levantine Corpus
[Paper] [Poster] [Video]
Karim Al-Haff¹, Mustafa Jarrar², Tymaa Hammouda², Fadi Zaraket³
¹University of Strasbourg, ²Birzeit University, ³American University of Beirut

Annotation Study of Japanese Judgments on Tort for Legal Judgment Prediction with Rationales
[Paper] [Poster] [Video]
Hiroaki Yamada¹, Takenobu Tokunaga¹, Ryutaro Ohara², Keisuke Takeshita³, Mihoko Sumida³
¹Tokyo Institute of Technology, ²Nakamura, Tsunoda & Matsumoto, ³Hitotsubashi University

Placing M-Phasis on the Plurality of Hate: A Feature-Based Corpus of Hate Online
[Paper] [Poster] [Video]
Dana Ruiter¹, Liane Reiners², Ashwin Geet D'Sa³, Thomas Kleinbauer¹, Dominique Fohr³, Irina Illina⁴, Dietrich Klakow¹, Christian Schemer², Angeliki Monnier⁵
¹Saarland University, ²Johannes Gutenberg University Mainz (JGU), ³LORIA-INRIA, ⁴LORIA/INRIA, ⁵Université de Lorraine

ParCorFull2.0: a Parallel Corpus Annotated with Full Coreference
[Paper] [Poster] [Video]
Ekaterina Lapshinova-Koltunski¹, Pedro Ferreira², Elina Lartaud³, Christian Hardmeier⁴
¹Universität des Saarlandes, ²University of Aveiro, ³Uppsala University, ⁴IT University of Copenhagen/Uppsala University

A Multi-Party Dialogue Ressource in French
[Paper] [Poster] [Video]
Maria Boritchev¹ and Maxime Amblard²
¹Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, EPC, ²Université de Lorraine

Bicleaner AI: Bicleaner Goes Neural
[Paper] [Video]
Jaume Zaragoza-Bernabeu¹, Gema Ramírez-Sánchez¹, Marta Bañón², Sergio Ortiz Rojas¹
¹Prompsit Language Engineering, ²Prompsit SL

Semi-automatically Annotated Learner Corpus for Russian
[Paper] [Poster] [Video]
Anisia Katinskaia¹, Maria Lebedeva², Jue Hou¹, Roman Yangarber¹
¹University of Helsinki, ²Language and Coginition Laboratory, Pushkin State Russian Language Institute

UniMorph 4.0: Universal Morphology
[Paper] [Video]
Khuyagbaatar Batsuren¹, Omer Goldman², Salam Khalifa³, Nizar Habash⁴, Witold Kieraś⁵, Gábor Bella⁶, Brian Leonard⁷, Garrett Nicolai⁸, Kyle Gorman⁹, Yustinus Ate¹⁰, Maria Ryskina¹¹, Sabrina Mielke⁷, Elena Budianskaya¹², Charbel El-Khaissi¹³, Tiago Pimentel¹⁴, Michael Gasser¹⁵, William Lane¹⁶, Mohit Raj¹⁷, Matt Coler¹⁸, Jaime Samame¹⁹, Delio Camaiteri²⁰, Esaú Rojas²⁰, Didier Francis²⁰, Arturo Oncevay²¹, Juan Bautista²⁰, Gema Villegas¹⁹, Lucas Hennigen¹⁴, Adam Ek²², David Guriel²³, Peter Dirix²⁴, Jean-Philippe Bernardy²², Andrey Scherbakov²⁵, Aziyana Bayyr-ool²⁶, Antonios Anastasopoulos²⁷, Roberto Zariquiey¹⁹, Karina Sheifer²⁸, Sofya Ganieva²⁹, Hilaria Cruz³⁰, Ritván Karahóǧa³¹, Stella Markantonatou³¹, George Pavlidis³¹, Matvey Plugaryov²⁹, Elena Klyachko³², Ali Salehi³³, Candy Angulo¹⁹, Jatayu Baxi³⁴, Andrew Krizhanovsky³⁵, Natalia Krizhanovskaya³⁵, Elizabeth Salesky⁷, Clara Vania³⁶, Sardana Ivanova³⁷, Jennifer White¹⁴, Rowan Maudslay¹⁴, Josef Valvoda¹⁴, Ran Zmigrod¹⁴, Paula Czarnowska¹⁴, Irene Nikkarinen¹⁴, Aelita Salchak³⁸, brijesh bhatt³⁴, Christopher Straughn³⁹, Zoey Liu⁴⁰, Jonathan Washington⁴¹, Yuval Pinter⁴², Duygu Ataman⁴³, Marcin Wolinski⁵, Totok Suhardijanto⁴⁴, Anna Yablonskaya⁴⁵, Niklas Stoehr⁴⁶, Hossep Dolatian³, Zahroh Nuriah⁴⁴, Shyam Ratan¹⁷, Francis Tyers⁴⁷, Edoardo Ponti⁴⁸, Grant Aiton¹³, Aryaman Arora⁴⁹, Richard Hatcher³³, Ritesh Kumar¹⁷, Jeremiah Young⁵⁰, Daria Rodionova⁴⁵, Anastasia Yemelina⁴⁵, Taras Andrushko⁴⁵, Igor Marchenko⁴⁵, Polina Mashkovtseva⁴⁵, Alexandra Serova⁴⁵, Emily Prud'hommeaux⁴⁰, Maria Nepomniashchaya⁴⁵, fausto giunchiglia⁵¹, Eleanor Chodroff⁵², Mans Hulden⁵³, Miikka Silfverberg⁸, Arya D. McCarthy⁷, David Yarowsky⁷, Ryan Cotterell⁴⁶, Reut Tsarfaty²³, Ekaterina Vylomova⁵⁴
¹National University of Mongolia, ²Bar Ilan University, ³Stony Brook University, ⁴New York University Abu Dhabi, ⁵Institute of Computer Science, Polish Academy of Sciences, ⁶University of Trento, ⁷Johns Hopkins University, ⁸University of British Columbia, ⁹The Graduate Center, City University of New York, ¹⁰STKIP Weetebula, ¹¹Carnegie Mellon University, ¹²Institute of Linguistics, Russian Academy of Sciences, ¹³Australian National University, ¹⁴University of Cambridge, ¹⁵Indiana University, ¹⁶Charles Darwin University, ¹⁷Dr. Bhimrao Ambedkar University, ¹⁸University of Groningen, ¹⁹Pontificia Universidad Católica del Perú, ²⁰Universidad Católica Sedes Sapientiae, Filial Atalaya, ²¹University of Edinburgh, ²²University of Gothenburg, ²³Bar-Ilan University, ²⁴Katholieke Universiteit Leuven, ²⁵The University of Melbourne, ²⁶Institute of Philology of the Siberian Branch of the Russian Academy of Sciences, ²⁷George Mason University, ²⁸Higher School of Economics; Institute of Linguistics, Russian Academy of Sciences; Institute for System Programming, Russian Academy of Sciences, ²⁹Moscow State University; Institute of Linguistics, Russian Academy of Sciences, ³⁰University of Louisville, ³¹ILSP/Athena RC, ³²Higher School of Economics; Institute of Linguistics, Russian Academy of Sciences, ³³University at Buffalo, ³⁴Dharmsinh Desai University, ³⁵Karelian Research Centre of the Russian Academy of Sciences, ³⁶Amazon, ³⁷University of Helsinki, ³⁸Tuvan State University, ³⁹Northeastern Illinois University, ⁴⁰Boston College, ⁴¹Swarthmore College, ⁴²Ben-Gurion University of the Negev, ⁴³University of Zürich, ⁴⁴Universitas Indonesia, ⁴⁵Higher School of Economics, ⁴⁶ETH Zürich, ⁴⁷Indiana University; Higher School of Economics, ⁴⁸Mila/McGill University Montreal, ⁴⁹Georgetown University, ⁵⁰University of Oregon, ⁵¹Univesity of Trento, ⁵²University of York, ⁵³University of Colorado Boulder, ⁵⁴University of Melbourne

Textinator: an Internationalized Tool for Annotation and Human Evaluation in Natural Language Processing and Generation
[Paper] [Poster] [Video]
Dmytro Kalpakchi¹ and Johan Boye²
¹KTH Royal Institute of Technology, ²KTH

CyberAgressionAdo-v1: a Dataset of Annotated Online Aggressions in French Collected through a Role-playing Game
[Paper] [Poster] [Video]
Anaïs Ollagnier¹, Elena Cabrio¹, Serena Villata¹, Catherine Blaya²
¹Université Côte d’Azur, Inria, CNRS, I3S, ²Université Côte d’Azur, CNRS, Unité de Recherche Migrations et Société (Urmis)

Finnish Hate-Speech Detection on Social Media Using CNN and FinBERT
[Paper] [Poster] [Video]
Md Saroar Jahan, Mourad Oussalah, Nabil Arhab
University of Oulu

15:15 - 16:35

Session: P7 - Multilinguality and Machine Translation (1) - Poster Area 2
Chair: Çöltekin, Çağrı

Empirical Analysis of Noising Scheme based Synthetic Data Generation for Automatic Post-editing
[Paper] [Poster] [Video]
Hyeonseok Moon¹, chanjun park², Seolhwa Lee³, Jaehyung Seo², Jungseob Lee², Sugyeong Eo², Heuiseok Lim²
¹glee889@korea.ac.kr, ²korea university, ³University of Copenhagen

Domain Mismatch Doesn't Always Prevent Cross-lingual Transfer Learning
[Paper] [Poster] [Video]
Daniel Edmiston¹, Phillip Keung², Noah A. Smith²
¹Amazon, ²University of Washington

Cross-Lingual Knowledge Transfer for Clinical Phenotyping
[Paper] [Poster] [Video]
Jens-Michalis Papaioannou¹, Paul Grundmann¹, Betty van Aken¹, Athanasios Samaras², Ilias Kyparissidis³, George Giannakoulas², Felix Gers⁴, Alexander Loeser⁵
¹Berliner Hochschule für Technik (BHT), ²First Department of Cardiology, AHEPA University Hospital, Aristotle University of Thessaloniki, Greece, ³Lab of Medical Physics, Aristotle University of Thessaloniki, Greece, ⁴Beuth Univeristy Berlin, ⁵Beuth-University of Applied Sciences Berlin

The Multilingual Microblog Translation Corpus: Improving and Evaluating Translation of User-Generated Text
[Paper] [Video]
Paul McNamee and Kevin Duh
Johns Hopkins University

Multilingual and Multimodal Learning for Brazilian Portuguese
[Paper] [Video]
Júlia Sato¹, Helena Caseli¹, Lucia Specia²
¹Federal University of São Carlos, ²Imperial College London

LibriS2S: A German-English Speech-to-Speech Translation Corpus
[Paper] [Poster] [Video]
Pedro Jeuris¹ and Jan Niehues²
¹Department of Data Science and Knowledge Engineering,Maastricht University, Netherlands, ²Karlsruhe Institut of Technology

A Linguistically Motivated Test Suite to Semi-Automatically Evaluate German--English Machine Translation Output
[Paper] [Poster] [Video]
Vivien Macketanz¹, Eleftherios Avramidis¹, Aljoscha Burchardt², He Wang¹, Renlong Ai², Shushen Manakhimova¹, Ursula Strohriegel¹, Sebastian Möller³, Hans Uszkoreit⁴
¹German Research Center for Artificial Intelligence (DFKI), ²DFKI, ³Quality and Usability Lab, TU Berlin, ⁴DFKI and Saarland University

Cross-lingual Transfer of Monolingual Models
[Paper] [Poster] [Video]
Evangelia Gogoulou¹, Ariel Ekgren², Tim Isbister², Magnus Sahlgren²
¹RISE, ²AI Sweden

Dataset of Student Solutions to Algorithm and Data Structure Programming Assignments
[Paper] [Poster] [Video]
Fynn Petersen-Frey¹, Marcus Soll², Louis Kobras¹, Melf Johannsen¹, Peter Kling¹, Chris Biemann¹
¹Universität Hamburg, ²Autal 20, 22880 Wedel, Germany

Language Patterns and Behaviour of the Peer Supporters in Multilingual Healthcare Conversational Forums
[Paper] [Poster] [Video]
Ishani Mondal¹, Kalika Bali², Mohit Jain³, Monojit Choudhury⁴, Jacki O'Neill⁵, Millicent Ochieng⁵, Kagnoya Awori⁵, Keshet Ronen⁶
¹Microsoft, ²Microsoft Research Labs, ³Microsoft Research India, ⁴Microsoft Research, ⁵Microsoft Africa Research Institute, ⁶University of Washington

Frame Shift Prediction
[Paper] [Poster] [Video]
Zheng Xin Yong¹, Patrick Watson², Tiago Timponi Torrent³, Oliver Czulo⁴, Collin Baker⁵
¹Brown University, ²Minerva University, ³Federal University of Juiz de Fora, ⁴Universität Leipzig, ⁵International Computer Science Institute

15:15 - 16:35

Session: P8 - Speech Resources and Processing (1) - Poster Area 2
Chair: Burkhardt, Felix

CLeLfPC: a Large Open Multi-Speaker Corpus of French Cued Speech
[Paper] [Poster] [Video]
Brigitte BIGI¹, Maryvonne Zimmermann², Carine André³
¹LPL, CNRS, ²Association nationale pour la promotion et le développement de la Langue française Parlée Complétée, ³LPL, CNRS, Aix-Marseille Univ.

Samrómur Children: An Icelandic Speech Corpus
[Paper] [Poster] [Video]
Carlos Daniel Hernandez Mena¹, David Erik Mollberg², Michal Borský³, Jón Guðnason³
¹University of Reykjavík, ²Reykjavik University, ³Reykiavík University

The Norwegian Parliamentary Speech Corpus
[Paper] [Poster] [Video]
Per Erik Solberg¹ and Pablo Ortiz²
¹National Library of Norway, ²Telenor Research

A Speech Recognizer for Frisian/Dutch Council Meetings
[Paper] [Video]
Martijn Bentum¹, Louis ten Bosch², Henk van den Heuvel³, Simone Wills³, Domenique van der Niet⁴, Jelske Dijkstra⁵, Hans Van de Velde⁵
¹Centre for Language Studies, Radboud University, ²Radboud University Nijmegen, ³CLS/CLST, Radboud University Nijmegen, ⁴Humainr, ⁵Fryske Akademy

Elderly Conversational Speech Corpus with Cognitive Impairment Test and Pilot Dementia Detection Experiment Using Acoustic Characteristics of Speech in Japanese Dialects
[Paper] [Video]
Meiko Fukuda¹, Ryota Nishimura¹, Maina Umezawa², Kazumasa Yamamoto³, Yurie Iribe⁴, Norihide Kitaoka⁵
¹Tokushima university, ²Aichi Prefectural University,, ³Chubu University, ⁴Aichi Prefectural University, ⁵Toyohashi University of Technology

A Spoken Drug Prescription Dataset in French for Spoken Language Understanding
[Paper] [Poster] [Video]
Ali Can Kocabiyikoglu¹, François Portet², Prudence Gibert³, Hervé Blanchon⁴, Jean-Marc Babouchkine⁵, Gaëtan Gavazzi³
¹University of Grenoble Alpes, ²Univ Grenoble Alpes, Laboratoire d'Informatique de Grenoble, ³CHU Grenoble Alpes, ⁴Univ. Grenoble Alpes, ⁵Calystene

Towards an Open-Source Dutch Speech Recognition System for the Healthcare Domain
[Paper] [Poster] [Video]
Cristian Tejedor-García¹, Berrie van der Molen², Henk van den Heuvel³, Arjan van Hessen⁴, Toine Pieters²
¹CLST, Radboud University, ²Freudenthal Institute, Utrecht University, Utrecht, the Netherlands, ³CLS/CLST, Radboud University Nijmegen, ⁴University of Twente

A Dataset for Speech Emotion Recognition in Greek Theatrical Plays
[Paper] [Poster] [Video]
Maria Moutti¹, Sofia Eleftheriou², Panagiotis Koromilas², Theodoros Giannakopoulos²
¹University of the Peloponnese, ²National Center for Scientific Research Demokritos

Audiobook Dialogues as Training Data for Conversational Style Synthetic Voices
[Paper] [Poster] [Video]
Liisi Piits, Hille Pajupuu, Heete Sahkai, Rene Altrov, Liis Ermus, Kairi Tamuri, Indrek Hein, Meelis Mihkla, Indrek Kiissel, Egert Männisalu, Kristjan Suluste, Jaan Pajupuu
Institute of the Estonian Language

Using a Knowledge Base to Automatically Annotate Speech Corpora and to Identify Sociolinguistic Variation
[Paper] [Video]
Yaru WU¹, Fabian Suchanek², Ioana Vasilescu³, Lori Lamel⁴, Martine Adda-Decker⁵
¹CRISCO/EA4255, Université de Caen Normandie, 14000 Caen, France; Laboratoire de Phonétique et Phonologie (UMR7018, CNRS-Sorbonne Nouvelle), France, ²Telecom Paris, ³LIMSI-CNRS, ⁴CNRS/LIMSI, ⁵LPP (Lab. Phonétique & Phonologie) / LIMSI-CNRS

Phone Inventories and Recognition for Every Language
[Paper] [Video]
Xinjian Li¹, Florian Metze¹, David R. Mortensen², Alan W Black¹, Shinji Watanabe¹
¹Carnegie Mellon University, ²Language Technologies Institute, Carnegie Mellon University

16:35 - 16:55

Coffee Break

16:55 - 18:15

Session O9: Bio-medical Corpora - Salle 120
Chair: Melero, Maite
Co-Chair: Bawden, Rachel

16:55 - 17:15

Constructing Parallel Corpora from COVID-19 News using MediSys Metadata
[Paper] [Slides] [Video]
Dimitrios Roussis¹, Vassilis Papavassiliou¹, Sokratis Sofianopoulos¹, Prokopis Prokopidis¹, Stelios Piperidis²
¹ILSP/Athena RC, ²Athena RC/ILSP

17:15 - 17:35

A Distant Supervision Corpus for Extracting Biomedical Relationships Between Chemicals, Diseases and Genes
[Paper] [Slides] [Video]
Dongxu Zhang¹, Sunil Mohan², Michaela Torkar², Andrew McCallum³
¹University of Massachusetts, Amherst, ²Chan Zuckerberg Initiative, ³UMass Amherst

17:35 - 17:55

DrugEHRQA: A Question Answering Dataset on Structured and Unstructured Electronic Health Records For Medicine Related Queries
[Paper] [Slides] [Video]
Jayetri Bardhan¹, Anthony Colas¹, Kirk Roberts², Daisy Wang¹
¹University of Florida, ²The University of Texas Health Science Center at Houston

17:55 - 18:15

Efficiently and Thoroughly Anonymizing a Transformer Language Model for Dutch Electronic Health Records: a Two-Step Method
[Paper] [Slides] [Video]
Stella Verkijk¹ and Piek Vossen²
¹Vrije Universiteit Amsterdam, ²VU University Amsterdam

16:55 - 18:15

Session O10: Parsing and Tagging - Salle 92
Chair: Simov, Kiril
Co-Chair: Gamba, Federica

16:55 - 17:15

BERTrade: Using Contextual Embeddings to Parse Old French
[Paper] [Slides] [Video]
Loïc Grobol¹, Mathilde Regnault², Pedro Ortiz Suarez³, Benoît Sagot⁴, Laurent Romary⁴, Benoit Crabbé⁵
¹Université Paris Nanterre, ²Universität Stuttgart, ³Data and Web Science Group, University of Mannheim, ⁴Inria, ⁵University of Paris

17:15 - 17:35

Out-of-Domain Evaluation of Finnish Dependency Parsing
[Paper] [Slides] [Video]
Jenna Kanerva and Filip Ginter
University of Turku

17:35 - 17:55

TArC: Tunisian Arabish Corpus, First complete release
[Paper] [Slides] [Video]
elisa gugliotta¹ and Marco Dinarelli²
¹Sapienza University of Rome, ²LIG

17:55 - 18:15

Towards Universal Segmentations: UniSegments 1.0
[Paper] [Slides] [Video]
Zdeněk Žabokrtský¹, Niyati Bafna¹, Jan Bodnár¹, Lukáš Kyjánek¹, Emil Svoboda¹, Magda Ševčíková¹, Jonáš Vidra²
¹Charles University, ²Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics

16:55 - 18:15

Session O11: Less-Resourced Languages - La Major
Chair: Bird, Steven
Co-Chair: Conforti, Costanza

16:55 - 17:15

TeDDi Sample: Text Data Diversity Sample for Language Comparison and Multilingual NLP
[Paper] [Slides] [Video]
Steven Moran¹, Christian Bentz², Ximena Gutierrez-Vasques³, Olga Sozinova³, Tanja Samardzic³
¹University of Neuchâtel, ²University of Tübingen, ³University of Zurich

17:15 - 17:35

Leveraging a Bilingual Dictionary to Learn Wolastoqey Word Representations
[Paper] [Video]
Diego Bear and Paul Cook
University of New Brunswick

17:35 - 17:55

Unmasking the Myth of Effortless Big Data - Making an Open Source Multi-lingual Infrastructure and Building Language Resources from Scratch
[Paper] [Slides] [Video]
Linda Wiechetek¹, Katri Hiovain-Asikainen¹, Inga Lill Sigga Mikkelsen², Sjur Moshagen², Flammie Pirinen¹, Trond Trosterud¹, Børre Gaup¹
¹UiT Norgga árktalaš universitehta, ²UiT The Arctic University of Norway

17:55 - 18:15

Building and curating conversational corpora for diversity-aware language science and technology
[Paper] [Video]
Andreas Liesenfeld and Mark Dingemanse
Radboud University

16:55 - 18:15

Session O12: Corpus Creation, Use and Evaluation (1) - Auditorium
Chair: Tadić, Marko
Co-Chair: Paccosi, Teresa

16:55 - 17:15

EPIC UdS - Creation and Applications of a Simultaneous Interpreting Corpus
[Paper] [Slides] [Video]
Heike Przybyl¹, Ekaterina Lapshinova-Koltunski², Katrin Menzel³, Stefan Fischer¹, Elke Teich²
¹Saarland University, ²Universität des Saarlandes, ³Saarland University, Department of Language Science and Technology

17:15 - 17:35

Development of a Benchmark Corpus to Support Entity Recognition in Job Descriptions
[Paper] [Slides] [Video]
Thomas Green¹, Diana Maynard¹, Chenghua Lin²
¹University of Sheffield, ²University of Aberdeen

17:35 - 17:55

CAMIO: A Corpus for OCR in Multiple Languages
[Paper] [Slides] [Video]
Michael Arrigo¹, Stephanie Strassel², Nolan King³, Thao Tran³, Lisa Mason³
¹Linguistic Data Consortium, ²Linguistic Data Consortium, University of Pennsylvania, ³US DOD

17:55 - 18:15

FABRA: French Aggregator-Based Readability Assessment toolkit
[Paper] [Video]
Rodrigo Wilkens¹, David Alfter², Xiaoou Wang³, Alice Pintard², Anaïs Tack⁴, Kevin P. Yancey⁵, Thomas François⁶
¹Université catholique de Louvain, ²UCLouvain, ³University of Louvain, ⁴Stanford University, ⁵Duolingo, ⁶UCLouvain, CENTAL

16:55 - 18:15

Session: P9 - Dialogue and Conversational Systems (1) - Poster Area 1
Chair: Mou, Lili

Towards Building a Spoken Dialogue System for Argument Exploration
[Paper] [Video]
Annalena Aicher¹, Nadine Gerstenlauer¹, Isabel Feustel¹, Wolfgang Minker¹, Stefan Ultes²
¹Ulm University, ²Mercedes-Benz AG

FreeTalky: Don’t Be Afraid! Conversations Made Easier by a Humanoid Robot using Persona-based Dialogue
[Paper] [Poster] [Video]
chanjun park¹, Yoonna Jang², Seolhwa Lee³, Sungjin Park⁴, Heuiseok Lim¹
¹korea university, ²Department of Computer Science and Engineering, Korea University, ³University of Copenhagen, ⁴NAVER Corp.

Self-Contained Utterance Description Corpus for Japanese Dialog
[Paper] [Video]
Yuta Hayashibe
Megagon Labs, Tokyo, Japan, Recruit Co., Ltd.

DialCrowd 2.0: A Quality-Focused Dialog System Crowdsourcing Toolkit
[Paper] [Poster] [Video]
Jessica Huynh¹, Ting-Rui Chiang¹, Jeffrey Bigham², Maxine Eskenazi¹
¹Carnegie Mellon University, ²CMU/Apple

A Brief Survey of Textual Dialogue Corpora
[Paper] [Poster] [Video]
Hugo Gonçalo Oliveira¹, Patrícia Ferreira², Daniel Martins³, Catarina Silva¹, Ana Alves⁴
¹CISUC, DEI, University of Coimbra, ²CISUC, University of Coimbra and ISEC, Instituto Politécnico de Coimbra, ³ISEC, Instituto Politécnico de Coimbra, ⁴CISUC - University of Coimbra and Polythecnic Institute of Coimbra

A Unified Approach to Entity-Centric Context Tracking in Social Conversations
[Paper] [Video]
Ulrich Rückert¹, Srinivas Sunkara¹, Abhinav Rastogi¹, Sushant Prakash², Pranav Khaitan¹
¹Google Research, ²Google

A Unifying View On Task-oriented Dialogue Annotation
[Paper] [Poster] [Video]
Vojtěch Hudeček¹, leon-paul Schaub², Daniel Stancl¹, Patrick Paroubek³, Ondřej Dušek¹
¹Charles University, ²LIMSI-CNRS/AKIO, ³University Paris-Saclay - CNRS - LISN

A Multi-source Graph Representation of the Movie Domain for Recommendation Dialogues Analysis
[Paper] [Poster] [Video]
Antonio Origlia¹, Martina Di Bratto², Maria Di Maro², Sabrina Mennella³
¹PRISCA Lab - Dept. of Electrical Engineering and Information Technology - University of Naples "Federico II", ²University of Naples Federico II, ³University of Catania

16:55 - 18:15

Session: P10 - Lexicons (1) - Poster Area 1
Chair: Olsen, Sussi

SHARE: A Lexicon of Harmful Expressions by Spanish Speakers
[Paper] [Poster] [Video]
Flor Miriam Plaza-del-Arco¹, Ana Belén Parras Portillo², Pilar López Úbeda¹, Beatriz Gil³, María-Teresa Martín-Valdivia⁴
¹University of Jaén, ²Universidad de Jaén, ³Universidad de Alicante, ⁴Univeristy of Jaen

Wiktextract: Wiktionary as Machine-Readable Structured Data
[Paper] [Video]
Tatu Ylonen
University of Helsinki

NyLLex: A Novel Resource of Swedish Words Annotated with Reading Proficiency Level
[Paper] [Poster] [Video]
Daniel Holmer and Evelina Rennes
Linköping University

Making a Semantic Event-type Ontology Multilingual
[Paper] [Poster] [Video]
Zdenka Uresova¹, Karolina Zaczynska², Peter Bourgonje³, Eva Fučíková¹, Georg Rehm⁴, Jan Hajic¹
¹Charles University, ²German Research Center for Artificial Intelligence, ³Morningsun Technology, ⁴DFKI

NomVallex: A Valency Lexicon of Czech Nouns and Adjectives
[Paper] [Poster] [Video]
Veronika Kolářová¹ and Anna Vernerová²
¹Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics, ²Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University

TZOS: an Online Terminology Database Aimed at Working on Basque Academic Terminology Collaboratively
[Paper] [Poster] [Video]
Izaskun Aldezabal¹, Jose Mari Arriola², Arantxa Otegi³
¹University of the Basque Country, ²UPV/EHU University of the Basque Country, ³University of the Basque Country UPV/EHU

Animacy Denoting German Nouns: Annotation and Classification
[Paper] [Poster] [Video]
Manfred Klenner¹ and Anne Göhring²
¹Computational Linguistics, University of Zurich, ²University of Zurich

16:55 - 18:15

Session: P11 - Opinion Mining, Sentiment and Emotion (1) - Poster Area 1
Chair: Kruschwitz, Udo

x-enVENT: A Corpus of Event Descriptions with Experiencer-specific Emotion and Appraisal Annotations
[Paper] [Poster] [Video]
Enrica Troiano, Laura Ana Maria Oberlaender, Maximilian Wegge, Roman Klinger
University of Stuttgart

Polar Quantification of Actor Noun Phrases for German
[Paper] [Video]
Anne Göhring¹ and Manfred Klenner²
¹University of Zurich, ²Computational Linguistics, University of Zurich

Czech Dataset for Cross-lingual Subjectivity Classification
[Paper] [Poster] [Video]
Pavel Přibáň¹ and Josef Steinberger²
¹University of West Bohemia, Faculty of Applied Sciences, ²University of West Bohemia

RED v2: Enhancing RED Dataset for Multi-Label Emotion Detection
[Paper] [Poster] [Video]
Alexandra Ciobotaru¹, Mihai Constantinescu², Liviu P. Dinu¹, Stefan Dumitrescu²
¹University of Bucharest, ²Independent researcher

16:55 - 18:15

Session: P12 - Evaluation and Validation Methodologies (1) - Poster Area 1
Chair: Refaee, Eshrag Ali A.

Fine-Grained Error Analysis and Fair Evaluation of Labeled Spans
[Paper] [Poster] [Video]
Katrin Ortmann
Ruhr-Universität Bochum

Probing Pre-trained Auto-regressive Language Models for Named Entity Typing and Recognition
[Paper] [Video]
Elena V. Epure and Romain Hennequin
Deezer Research

Frustratingly Easy Performance Improvements for Low-resource Setups: A Tale on BERT and Segment Embeddings
[Paper] [Poster] [Video]
Rob van der Goot¹, Max Müller-Eberstein¹, Barbara Plank²
¹IT University of Copenhagen, ²LMU Munich

The Subject Annotations of the Danish Parliament Corpus (2009-2017) - Evaluated with Automatic Multi-label Classification
[Paper] [Poster] [Video]
Costanza Navarretta¹ and Dorte Haltrup Hansen²
¹University of Copenhagen, ²University od Copenhagen

A Systematic Study Reveals Unexpected Interactions in Pre-Trained Neural Machine Translation
[Paper] [Poster] [Video]
Ashleigh Richardson and Janet Wiles
University of Queensland

Holistic Evaluation of Automatic TimeML Annotators
[Paper] [Video]
Mustafa Ocal¹, Adrian Perez², Antonela Radas², Mark Finlayson²
¹Florida International University, ²FIU

Measuring Uncertainty in Translation Quality Evaluation (TQE)
[Paper] [Poster] [Video]
Serge Gladkoff¹, Irina Sorokina¹, Lifeng Han², Alexandra Alekseeva³
¹Logrus Global, ²Dublin City University, ³ROKO lab

Challenging the Transformer-based models with a Classical Arabic dataset: Quran and Hadith
[Paper] [Poster] [Video]
Shatha Altammami and Eric Atwell
university of leeds

Question Modifiers in Visual Question Answering
[Paper] [Poster] [Video]
William Britton¹, Somdeb Sarkhel², Deepak Venugopal³
¹University of Memphis, ²Adobe, ³The University of Memphis

16:55 - 18:15

Session: P13 - Multimodality and Cross-modality (1) - Poster Area 1
Chair: Favre, Benoit

Multimodal Pipeline for Collection of Misinformation Data from Telegram
[Paper] [Poster] [Video]
Jose Sosa and Serge Sharoff
University of Leeds

Identifying Tension in Holocaust Survivors’ Interview: Code-switching/Code-mixing as Cues
[Paper] [Poster] [Video]
Xinyuan Xia, Lu Xiao, Kun Yang, Yueyue Wang
Syracuse University

Fine-tuning vs From Scratch: Do Vision & Language Models Have Similar Capabilities on Out-of-Distribution Visual Question Answering?
[Paper] [Poster] [Video]
Kristian Nørgaard Jensen¹ and Barbara Plank²
¹IT University of Copenhagen, ²LMU Munich

Multilingual Image Corpus – Towards a Multimodal and Multilingual Dataset
[Paper] [Video]
Svetla Koeva¹, Ivelina Stoyanova², Jordan Kralev³
¹Institute for Bulgarian Language "Prof. Lyubomir Andreychin", Bulgarian Academy of Sciences, ²Department of Computational Linguistics, IBL - BAS, ³Technical university, Sofia

Sign Language Production With Avatar Layering: A Critical Use Case over Rare Words
[Paper] [Video]
Jung-Ho Kim¹, Eui Jun Hwang², Sukmin Cho¹, Du Hui Lee³, Jong Park²
¹Korea Advanced Institute of Science and Technology, ²KAIST, ³EQ4ALL

The VoxWorld Platform for Multimodal Embodied Agents
[Paper] [Video]
Nikhil Krishnaswamy¹, William Pickard¹, Brittany Cates¹, Nathaniel Blanchard¹, James Pustejovsky²
¹Colorado State University, ²Brandeis University

MemoSen: A Multimodal Dataset for Sentiment Analysis of Memes
[Paper] [Poster] [Video]
Eftekhar Hossain¹, Omar Sharif¹, Mohammed Moshiul Hoque²
¹Chittagong University of Engineering and Technology (CUET), ²Department of Computer Science & Engineering, Chittagong University of Engineering & Technology

RUSAVIC Corpus: Russian Audio-Visual Speech in Cars
[Paper] [Video]
Denis Ivanko, Alexandr Axyonov, Dmitry Ryumin, Alexey Kashevnik, Alexey Karpov
SPC RAS

A First Corpus of AZee Discourse Expressions
[Paper] [Poster] [Video]
Camille Challant¹ and Michael Filhol²
¹Université Paris-Saclay, CNRS, LISN, ²LISN, CNRS, Université Paris-Saclay

BERTHA: Video Captioning Evaluation Via Transfer-Learned Human Assessment
[Paper] [Poster] [Video]
Luis Lebron¹, Yvette Graham², Kevin McGuinness¹, Konstantinos Kouramas³, Noel O'Connor¹
¹Insight SFI Centre for Data Analytics @DCU, ²ADAPT, Trinity College Dublin, ³Collins Aerospace

Abstract Meaning Representation for Gesture
[Paper] [Video]
Richard Brutti¹, Lucia Donatelli², Kenneth Lai¹, James Pustejovsky¹
¹Brandeis University, ²Saarland University

18:20 - 19:30

ELRA General Meeting - Auditorium
[Video]

20:00

LREC 2022 Welcome Reception - Palais du Pharo

End of Day 1