AAMAS 2019: Proceedings of the 2019 International Conference on Autonomous Agents and Multiagent Systems

Table of Contents

Chairs' Welcome

AAMAS 2019 Conference Organization

AAMAS'19 Area Chairs

AAMAS 2019 Senior Program Committee

AAMAS 2019 Program Committee

AAMAS 2019 Additional Reviewers

Awards

AAMAS 2019 Sponsors & Supporters

(Return to Top)

Keynote Talks	4C: Deep Learning
1A: Reinforcement Learning 1	4D: Robotics
1B: Socially Intelligent Agents 1	4E: Game Theory 3
1C: Multi-Robot Systems	4F: Communication and Argumentation 1
1D: Verification and Validation	5A: Learning Agents
1E: Economic Paradigms: Learning and Adaptation	5B: Human-Robot interaction
1F: Agent Societies and Societal Issues 1	5C: Industrial Applications Track
2A: Reinforcement Learning 2	5D: Social Choice Theory 3
2B: Practicial Applications of Game Theory	5E: Auctions and Mechanism Design
2C: Knowledge Representation and Reasoning	5F: Agent Cooperation 1
2D: Social Choice Theory 1	5G: Networks
2E: Game Theory 1	6A: Agent-Based Simulation
2F: Agent Societies and Societal Issues 2	6B: Auctions and Mechanism Design
3A: Learning and Adaptation	6C: Engineering Multiagent Systems 2
3B: Socially Intelligent Agents 2	6D: Blue Sky
3C: Engineering Multiagent Systems 1	6E: Agent Cooperation 2
3D: Social Choice Theory 2	6F: Communication and Argumentation 2
3E: Game Theory 2	6G: Planning & Learning
3F: Logics for Agents	Extended Abstracts
4A: Learning Agent Capabilities	Demonstrations
4B: Multimodal Interaction	Doctoral Consortium

(Return to Top)

Keynote Talks

Synthesizing Explainable Behavior for Human-AI Collaboration (Page 1)
Subbarao Kambhampati (Arizona State University)

Preferences and Ethical Priorities: Thinking Fast and Slow in AI (Page 3)
Francesca Rossi (IBM Research)
Andrea Loreggia (University of Padova)

Responsible Autonomy (Page 5)
Carles Sierra (IIIA-CSIC)

Building Knowledge for AI Agents with Reinforcement Learning (Page 6)
Doina Precup (McGill University &amo; DeepMind)

Session: 1A: Reinforcement Learning 1

Bayesian Reinforcement Learning in Factored POMDPs (Page 7)
Sammie Katt (Northeastern University)
Frans A. Oliehoek (Delft University of Technology)
Christopher Amato (Northeastern University)

Competitive Bridge Bidding with Deep Neural Networks (Page 16)
Jiang Rong (Institute of Computing Technology, Chinese Academy of Sciences & University of Chinese Academy of Sciences)
Tao Qin (Microsoft Research Asia)
Bo An (Nanyang Technological University)

Learning Curriculum Policies for Reinforcement Learning (Page 25)
Sanmit Narvekar (University of Texas at Austin)
Peter Stone (University of Texas at Austin)

Model Primitive Hierarchical Lifelong Reinforcement Learning (Page 34)
Bohan Wu (Columbia University)
Jayesh K. Gupta (Stanford University)
Mykel J. Kochenderfer (Stanford University)

Negative Update Intervals in Deep Multi-Agent Reinforcement Learning (Page 43)
Gregory Palmer (University of Liverpool)
Rahul Savani (University of Liverpool)
Karl Tuyls (University of Liverpool)

Self-Improving Generative Adversarial Reinforcement Learning (Page 52)
Yang Liu (Teesside University)
Yifeng Zeng (Teesside University)
Yingke Chen (Teesside University)
Jing Tang (Teesside University)
Yinghui Pan (Jiangxi Uni. of Finance&Economics)

(Return to Top)

Session: 1B: Socially Intelligent Agents 1

A Child and a Robot Getting Acquainted - Interaction Design for Eliciting Self-Disclosure (Page 61)
Mike Ligthart (Vrije Universiteit Amsterdam)
Timo Fernhout (Delft University of Technology)
Mark A. Neerincx (Delft University of Technology & TNO Soesterberg)
Kelly L. A. van Bindsbergen (Emma Children's Hospital, Amsterdam UMC & Princess Máxima Center for pediatric oncology)
Martha A. Grootenhuis (Princess Máxima Center for pediatric oncology)
Koen V. Hindriks (Vrije Universiteit Amsterdam)

The Effect of Virtual Agent Warmth on Human-Agent Negotiation (Page 71)
Pooja Prajod (Delft University of Technology)
Mohammed Al Owayyed (Delft University of Technology)
Tim Rietveld (Delft University of Technology)
Jaap-Jan van der Steeg (Delft University of Technology)
Joost Broekens (Delft University of Technology)

Anticipatory Bayesian Policy Selection for Online Adaptation of Collaborative Robots to Unknown Human Types (Page 77)
O. Can Görür (DAI-Labor, Technische Universität Berlin)
Benjamin Rosman (CSIR, and University of the Witwatersrand)
Sahin Albayrak (DAI-Labor, Technische Universität Berlin)

Irony Man: Augmenting a Social Robot with the Ability to Use Irony in Multimodal Communication with Humans (Page 86)
Hannes Ritschel (Augsburg University)
Ilhan Aslan (Augsburg University)
David Sedlbauer (Augsburg University)
Elisabeth André (Augsburg University)

Active Attention-Modified Policy Shaping (Page 728)
Taylor Kessler Faulkner (University of Texas at Austin)
Reymundo A. Gutierrez (University of Texas at Austin)
Elaine Schaertl Short (University of Texas at Austin)
Guy Hoffman (Cornell University)
Andrea L. Thomaz (University of Texas at Austin)

Domain Authoring Assistant for Intelligent Virtual Agent (Page 104)
Sepehr Janghorbani (Rutgers University at New Brunswick)
Ashutosh Modi (Disney Research)
Jakob Buhmann (Disney Research)
Mubbasir Kapadia (Rutgers University at New Brunswick)

(Return to Top)

Session: 1C: Multi-Robot Systems

Minimizing Travel in the Uniform Dispersal Problem for Robotic Sensors (Page 113)
Michael Amir (Technion -- Israel Institute of Technology)
Alfred M. Bruckstein (Technion -- Israel Institute of Technology)

Trust-Aware Behavior Reflection for Robot Swarm Self-Healing (Page 122)
Rui Liu (Carnegie Mellon University)
Fan Jia (Carnegie Mellon University)
Wenhao Luo (Carnegie Mellon University)
Meghan Chandarana (Carnegie Mellon University)
Changjoo Nam (Korea Institute of Science and Technology)
Michael Lewis (University of Pittsburgh)
Katia Sycara (Carnegie Mellon University)

Multi-Agent Path Finding for UAV Traffic Management (Page 131)
Florence Ho (National Institute of Informatics)
Ana Salta (INESC-ID and Instituto Superior Tecnico, Universidade Lisboa)
Ruben Geraldes (National Institute of Informatics)
Artur Goncalves (National Institute of Informatics)
Marc Cavazza (University of Greenwich)
Helmut Prendinger (National Institute of Informatics)

Distributed Self-Reconfiguration using a Deterministic Autonomous Scaffolding Structure (Page 140)
Pierre Thalamy (University of Bourgogne Franche-Comté, FEMTO-ST, CNRS)
Benoit Piranda (University of Bourgogne Franche-Comté, FEMTO-ST, CNRS)
Julien Bourgeois (University of Bourgogne Franche-Comté, FEMTO-ST, CNRS)

Swarms Can be Rational (Page 149)
Yinon Douchan (Tel Aviv University)
Ran Wolf (Bar Ilan University)
Gal Kaminka (The MAVERICK Group & Bar-Ilan University)

A Complete Multi-Robot Path-Planning Algorithm: JAAMAS Track (Page 158)
Ebtehal Turki Saho Alotaibi (Al-Imam Mohammad Ibn Saud Islamic University)

(Return to Top)

Session: 1D: Verification and Validation

A Counter Abstraction Technique for the Verification of Probabilistic Swarm Systems (Page 161)
Alessio Lomuscio (Imperial College London)
Edoardo Pirovano (Imperial College London)

Decidable Model Checking with Uniform Strategies (Page 170)
Natasha Alechina (University of Nottingham)
Mehdi Dastani (Utrecht University)
Brian Logan (University of Nottingham)

Formal Verification of Open Multi-Agent Systems (Page 179)
Panagiotis Kouvaros (Imperial College London)
Alessio Lomuscio (Imperial College London)
Edoardo Pirovano (Imperial College London)
Hashan Punchihewa (Imperial College London)

Enforcing Equilibria in Multi-Agent Systems (Page 188)
Giuseppe Perelli (University of Leicester)

On Domination and Control in Strategic Ability (Page 197)
Damian Kurpiewski (Polish Academy of Sciences)
Michał Knapik (Polish Academy of Sciences)
Wojciech Jamroga (Polish Academy of Sciences)

Resource-bounded ATL: the Quest for Tractable Fragments (Page 206)
Francesco Belardinelli (Imperial College London & Université d'Evry)
Stéphane Demri (LSV, CNRS, ENS Paris-Saclay, Université Paris-Saclay)

(Return to Top)

Session: 1E: Economic Paradigms: Learning and Adaptation

Automated Mechanism Design via Neural Networks (Page 215)
Weiran Shen (IIIS, Tsinghua University)
Pingzhong Tang (IIIS, Tsinghua University)
Song Zuo (Google Research)

Monte Carlo Continual Resolving for Online Strategy Computation in Imperfect Information Games (Page 224)
Michal Šustr (Czech Technical University)
Vojtech Kovarik (Czech Technical University)
Viliam Lisý (Czech Technical University)

Multi-Agent Learning in Network Zero-Sum Games is a Hamiltonian System (Page 233)
James P. Bailey (Singapore University of Technology and Design)
Georgios Piliouras (Singapore University of Technology and Design)

Optimal Value of Information Based Elicitation During Negotiation (Page 242)
Yasser Mohammad (AIST & Assiut University)
Shinji Nakadai (NEC-AIST Collaboration Laboratory)

Reinforcement Learning in Stationary Mean-field Games (Page 251)
Jayakumar Subramanian (McGill University)
Aditya Mahajan (McGill University)

RLBOA: A Modular Reinforcement Learning Framework for Autonomous Negotiating Agents (Page 260)
Jasper Bakker (University of Amsterdam)
Aron Hammond (University of Amsterdam)
Daan Bloembergen (Centrum Wiskunde & Informatica)
Tim Baarslag (Centrum Wiskunde & Informatica)

(Return to Top)

Session: 1F: Agent Societies and Societal Issues 1

Cooperation with Bottom-up Reputation Dynamics (Page 269)
Jason Xu (Monash University)
Julian García (Monash University)
Toby Handfield (Monash University)

Dynamic Source Weight Computation for Truth Inference over Data Streams (Page 277)
Yi Yang (Auckland University of Technilogy)
Quan Bai (University of Tasmania)
Qing Liu (CSIRO)

Egocentric Bias and Doubt in Cognitive Agents (Page 286)
Nanda Kishore Sreenivas (Oracle)
Shrisha Rao (International Institute of Information Technology, Bangalore)

Optimal Control of Complex Systems through Variational Inference with a Discrete Event Decision Process (Page 296)
Fan Yang (University at Buffalo)
Bo Liu (Auburn University)
Wen Dong (University at Buffalo)

Attacking Similarity-Based Link Prediction in Social Networks (Page 305)
Kai Zhou (Washington University in St. Louis)
Tomasz P. Michalak (University of Warsaw)
Marcin Waniek (Khalifa University of Science and Technology)
Talal Rahwan (Khalifa University of Science and Technology)
Yevgeniy Vorobeychik (Washington University in St. Louis)

Removing Malicious Nodes from Networks (Page 314)
Sixie Yu (Washington University in St. Louis)
Yevgeniy Vorobeychik (Washington University in St. Louis)

(Return to Top)

Session: 2A: Reinforcement Learning 2

NoRML: No-reward Meta Learning (Page 323)
Yuxiang Yang (Robotics at Google)
Ken Caluwaerts (Robotics at Google)
Atil Iscen (Robotics at Google)
Jie Tan (Robotics at Google)
Chelsea Finn (Robotics at Google)

Prediction in Intelligence: An Empirical Comparison of Off-policy Algorithms on Robots (Page 332)
Banafsheh Rafiee (University of Alberta)
Sina Ghiassian (University of Alberta)
Adam White (University of Alberta)
Richard S. Sutton (University of Alberta)

Reinforcement Learning for Cooperative Overtaking (Page 341)
Chao Yu (Dalian University of Technology)
Xin Wang (Dalian University of Technology)
Jianye Hao (Tianjin University)
Zhanbo Feng (Dalian University of Technology)

Robust Temporal Difference Learning for Critical Domains (Page 350)
Richard Klima (University of Liverpool)
Daan Bloembergen (Centrum Wiskunde & Informatica (CWI))
Michael Kaisers (Centrum Wiskunde & Informatica (CWI))
Karl Tuyls (University of Liverpool)

Urban Driving with Multi-Objective Deep Reinforcement Learning (Page 359)
Changjian Li (University of Waterloo)
Krzysztof Czarnecki (University of Waterloo)

How You Act Tells a Lot: Privacy-Leaking Attack on Deep Reinforcement Learning (Page 368)
Xinlei Pan (University of California, Berkeley)
Weiyao Wang (Duke University)
Xiaoshuai Zhang (Peking University)
Bo Li (University of Illinois at Urbana-Champaign)
Jinfeng Yi (JD AI Research)
Dawn Song (University of California, Berkeley)

(Return to Top)

Session: 2B: Practicial Applications of Game Theory

From Matching with Diversity Constraints to Matching with Regional Quotas (Page 377)
Haris Aziz (University of New South Wales, Sydney & Data61, CSIRO)
Serge Gaspers (University of New South Wales, Sydney & Data61, CSIRO)
Zhaohong Sun (University of New South Wales, Sydney & Data61, CSIRO)
Toby Walsh (University of New South Wales, Sydney & Data61, CSIRO)

Coordinating the Crowd: Inducing Desirable Equilibria in Non-Cooperative Systems (Page 386)
David Mguni (PROWLER.io)
Joel Jennings (PROWLER.io)
Emilio Sison (Massachusetts Institute of Technology)
Sergio Valcarcel Macua (PROWLER.io)
Sofia Ceppi (PROWLER.io)
Enrique Munoz de Cote (PROWLER.io)

Don't Put All Your Strategies in One Basket: Playing Green Security Games with Imperfect Prior Knowledge (Page 395)
Shahrzad Gholami (University of Southern California)
Amulya Yadav (Pennsylvania State University College of Information Sciences and Technology)
Long Tran-Thanh (University of Southampton, UK Electronics and)
Bistra Dilkina (University of Southern California)
Milind Tambe (University of Southern California)

Incentivizing Distributive Fairness for Crowdsourcing Workers (Page 404)
Chenxi Qiu (Rowan University)
Anna Squicciarini (The Pennsylvania State University)
Benjamin Hanrahan (The Pennsylvania State University)

Generalized Matching Games for International Kidney Exchange (Page 413)
Péter Biró (Institute of Economics, Hungarian Academy of Sciences)
Walter Kern (University of Twente)
Dömötör Pálvölgyi (ELTE)
Daniel Paulusma (Durham University)

Contingent Payment Mechanisms for Resource Utilization (Page 422)
Hongyao Ma (Harvard University)
Reshef Meir (Technion -- Israel Institute if Technology)
David C. Parkes (Harvard University)
James Zou (Stanford University)

(Return to Top)

Session: 2C: Knowledge Representation and Reasoning

Experiential Preference Elicitation for Autonomous Heating and Cooling Systems (Page 431)
Andrew Perrault (University of Southern California)
Craig Boutilier (Google)

Goal Recognition for Rational and Irrational Agents (Page 440)
Peta Masters (RMIT University)
Sebastian Sardina (RMIT University)

Interleaved Q-Learning with Partially Coupled Training Process (Page 449)
Min He (University of Electronics Science and Technology of China)
Hongliang Guo (University of Electronic Science and Technology of China School of Automation Engineering)

Multiagent Disjunctive Temporal Networks (Page 458)
Nikhil Bhargava (Massachusetts Institution of Technology)
Brian Williams (Massachusetts Institution of Technology)

Soft Labeling in Stochastic Shortest Path Problems (Page 467)
Luis Pineda (University of Massachusetts Amherst & Facebook AI Research)
Shlomo Zilberstein (University of Massachusetts, Amherst)

Parameterized Heuristics for Incomplete Weighted CSPs with Elicitation Costs (Page 476)
Atena M. Tabakhi (Washington University in St. Louis)
William Yeoh (Washington University in St. Louis)
Makoto Yokoo (Kyushu University)

(Return to Top)

Session: 2D: Social Choice Theory 1

Monotonicity Axioms in Approval-based Multi-winner Voting Rules (Page 485)
Luis Sanchez-Fernandez (Universidad Carlos III de Madrid)
Jesus A. Fisteus (Universidad Carlos III de Madrid)

Approximation Algorithms for BalancedCC Multiwinner Rules (Page 494)
Markus Brill (TU Berlin)
Piotr Faliszewski (AGH University)
Frank Sommer (Philipps-Universität Marburg)
Nimrod Talmon (Ben-Gurion University)

Parameterized Complexity of Committee Elections with Dichotomous and Trichotomous Votes (Page 503)
Aizhong Zhou (Shandong University)
Jiong Guo (Shandong University)
Yongjie Yang (Saarland University Chair of Economic Theory)

Gehrlein Stability in Committee Selection: Parameterized Hardness and Algorithms (Page 511)
Sushmita Gupta (National Institute for Science Education and Research)
Pallavi Jain (Institute of Mathematical Sciences)
Sanjukta Roy (The institute of Mathematical Sciences)
Saket Saurabh (The Institute of Mathematical Sciences)
Meirav Zehavi (Ben-Gurion University)

Exploring the No-Show Paradox for Condorcet Extensions Using Ehrhart Theory and Computer Simulations (Page 520)
Felix Brandt (Technische Universität München)
Johannes Hofbauer (Technische Universität München)
Martin Strobel (National University of Singapore)

Manipulating Elections by Selecting Issues (Page 529)
Jasper Lu (Vanderbilt University)
David Kai Zhang (Vanderbilt University)
Zinovi Rabinovich (Nanyang Technological University)
Svetlana Obraztsova (Nanyang Technological University)
Yevgeniy Vorobeychik (Washington University in St. Louis)

(Return to Top)

Session: 2E: Game Theory 1

Attacking Power Indices by Manipulating Player Reliability (Page 538)
Gabriel Istrate (West University of Timişoara & e-Austria Research Institute)
Cosmin Bonchiş (West University of Timişoara & e-Austria Research Institute)
Alin Brînduşescu (West University of Timişoara & Elektrobit Automotive Romania)

Cooperation via Codes in Restricted Hat Guessing Games (Page 547)
Kai Jin (The Hong Kong University of Science and Technology)
Ce Jin (Tsinghua University)
Zhaoquan Gu (Guangzhou University)

Incentivizing Collaboration in a Competition (Page 556)
Arunesh Sinha (University of Michigan)
Michael P. Wellman (University of Michigan)

Hedonic Diversity Games (Page 565)
Robert Bredereck (TU Berlin)
Edith Elkind (University of Oxford)
Ayumi Igarashi (Kyushu University)

Local Core Stability in Simple Symmetric Fractional Hedonic Games (Page 574)
Raffaello Carosi (Gran Sasso Science Institute, L'aquila)
Gianpiero Monaco (University of L'Aquila)
Luca Moscardelli (University of Chieti-Pescara)

Many-to-Many Stable Matchings with Ties, Master Preference Lists, and Matroid Constraints (Page 583)
Naoyuki Kamiyama (Kyushu University & JST PRESTO)

(Return to Top)

Session: 2F: Agent Societies and Societal Issues 2

Strategic Responsibility Under Imperfect Information (Page 592)
Vahid Yazdanpanah (University of Twente)
Mehdi Dastani (Utrecht University)
Wojciech Jamroga (Polish Academy of Sciences)
Natasha Alechina (University of Nottingham)
Brian Logan (University of Nottingham)

The Diverse Cohort Selection Problem (Page 601)
Candice Schumann (University of Maryland)
Samsara N. Counts (George Washington University)
Jeffrey S. Foster (Tufts University)
John P. Dickerson (University of Maryland)

An Evolutionary Approach to Find Optimal Policies with an Agent-Based Simulation (Page 610)
Nicolas De Bufala (Sorbonne Université Sciences)
Jean-Daniel Kant (Sorbonne Université Sciences)

The Volatility of Weak Ties: Co-evolution of Selection and Influence in Social Networks (Page 619)
Jie Gao (Stony Brook University)
Grant Schoenebeck (University of Michigan)
Fang-Yi Yu (University of Michigan)

Covert Networks: How Hard is It to Hide? (Page 628)
Palash Dey (Indian Institute of Technology Kharagpur)
Sourav Medya (University of California, Santa Barbara)

Privacy-Preserving Federated Data Sharing (Page 638)
Ferdinando Fioretto (Georgia Institute of Technology)
Pascal Van Hentenryck (Georgia Institute of Technology)

(Return to Top)

Session: 3A: Learning and Adaptation

Agent Behavioral Analysis Based on Absorbing Markov Chains (Page 647)
Riccardo Sartea (University of Verona)
Alessandro Farinelli (University of Verona)
Matteo Murari (University of Verona)

Agent Embeddings: A Latent Representation for Pole-Balancing Networks (Page 656)
Oscar Chang (Columbia University in the City of New York)
Robert Kwiatkowski (Columbia University in the City of New York)
Siyuan Chen (Columbia University in the City of New York)
Hod Lipson (Columbia University in the City of New York)

Courtesy as a Means to Coordinate (Page 665)
Panayiotis Danassis (École Polytechnique Fédérale de Lausanne)
Boi Faltings (École Polytechnique Fédérale de Lausanne)

Dynamic Particle Allocation to Solve Interactive POMDP Models for Social Decision Making (Page 674)
Rohith Dwarakanath Vallam (IBM Research - India)
Sarthak Ahuja (Carnegie Mellon University (CMU))
Surya Shravan Kumar Sajja (IBM Research - India)
Ritwik Chaudhuri (IBM Research - India)
Rakesh Pimplikar (IBM Research - India)
Kushal Mukherjee (IBM Research - India)
Ramasuri Narayanam (IBM Research - India)
Gyana Parija (IBM Research - India)

Evolving Intrinsic Motivations for Altruistic Behavior (Page 683)
Jane X. Wang (DeepMind)
Edward Hughes (DeepMind)
Chrisantha Fernando (DeepMind)
Wojciech M. Czarnecki (DeepMind)
Edgar A. Duéñez-Guzmán (DeepMind)
Joel Z. Leibo (DeepMind)

On the Pitfalls of Measuring Emergent Communication (Page 693)
Ryan Lowe (MILA & Facebook AI Research)
Jakob Foerster (Facebook AI Research)
Y-Lan Boureau (Facebook AI Research)
Joelle Pineau (MILA & Facebook AI Research)
Yann Dauphin (Google AI)

(Return to Top)

Session: 3B: Socially Intelligent Agents 2

What do we express without knowing? Emotion in Gesture (Page 702)
Gabriel Castillo (University of California, Davis)
Michael Neff (University of California, Davis)

Bootstrapped Policy Gradient for Difficulty Adaptation in Intelligent Tutoring Systems (Page 711)
Yaqian Zhang (Nanyang Technological University)
Wooi-Boon Goh (Nanyang Technological University)

Newtonian Action Advice: Integrating Human Verbal Instruction with Reinforcement Learning (Page 720)
Samantha Krening (Georgia Institute of Technology)
Karen M. Feigh (Georgia Institute of Technology)

An Optimization Approach for Structured Agent-Based Provider/Receiver Tasks (Page 95)
Kim Baraka (Instituto Superior Técnico / INESC-ID, Universidade de Lisboa & Carnegie Mellon University)
Marta Couto (Hospital Garcia de Orta, EPE)
Francisco S. Melo (Universidade de Lisboa & Instituto Superior Técnico / INESC-ID)
Manuela Veloso (Carnegie Mellon University)

Using Reinforcement Learning to Optimize the Policies of an Intelligent Tutoring System for Interpersonal Skills Training (Page 737)
Kallirroi Georgila (University of Southern California)
Mark G. Core (University of Southern California)
Benjamin D. Nye (University of Southern California)
Shamya Karumbaiah (University of Pennsylvania)
Daniel Auerbach (University of Southern California)
Maya Ram (University of Southern California)

Reaching Cooperation using Emerging Empathy and Counter-empathy (Page 746)
Jize Chen (Harbin Institute of Technology)
Changhong Wang (Harbin Institute of Technology)

(Return to Top)

Session: 3C: Engineering Multiagent Systems 1

Evaluating the Effectiveness of Multi-Agent Organisational Paradigms in a Real-Time Strategy Environment: Engineering Multiagent Systems Track (Page 754)
Buster A. Bernstein (Delft University of Technology)
Jasper C.M. Geurtz (Delft University of Technology)
Vincent J. Koeman (Delft University of Technology)

Agent-Environment Interactions in Large-Scale Multi-Agent Based Simulation Systems (Page 763)
Mohammad Al-Zinati (Jordan University of Science and Technology)
Rym Zalila-Wenkstern (The University of Texas at Dallas)

Robust Decentralised Agent Based Approach for Microgrid Energy Management (Page 772)
Sandra Garcia-Rodriguez (CEA, LIST)
Jorge J. Gomez-Sanz (Universidad Complutense de Madrid)

Supple: Multiagent Communication Protocols with Causal Types (Page 781)
Akin Günay (Lancaster University)
Amit K. Chopra (Lancaster University)
Munindar P. Singh (North Carolina State University)

Engineering Scalable Distributed Environments and Organizations for MAS (Page 790)
Alessandro Ricci (University of Bologna)
Andrei Ciortea (University of St. Gallen)
Simon Mayer (University of St. Gallen)
Olivier Boissier (University Lyon, MINES Saint-Etienne)
Rafael H. Bordini (School of Technology, PUCRS)
Jomi Fred Hubner (Federal University of Santa Catarina)

Decentralised Planning for Multi-Agent Programming Platforms (Page 799)
Rafael C. Cardoso (University of Liverpool)
Rafael H. Bordini (PUCRS)

(Return to Top)

Session: 3D: Social Choice Theory 2

Complexity of Manipulation in Premise-Based Judgment Aggregation with Simple Formulas (Page 819)
Robert Bredereck (TU Berlin)
Junjie Luo (University of Chinese Academy of Sciences)

Multi-Issue Opinion Diffusion under Constraints (Page 828)
Sirin Botan (ILLC, University of Amsterdam)
Umberto Grandi (IRIT, University of Toulouse)
Laurent Perrussel (IRIT, University of Toulouse)

Multiple Assignment Problems under Lexicographic Preferences (Page 837)
Hadi Hosseini (Rochester Institute of Technology)
Kate Larson (University of Waterloo)

Towards Completing the Puzzle: Solving Open Problems for Control in Elections (Page 846)
Gábor Erdélyi (University of Canterbury)
Christian Reger (University of Siegen)
Yongjie Yang (Saarland University & Central South University)

Testing Preferential Domains using Sampling (Page 855)
Palash Dey (Indian Institute of Technology Kharagpur)
Swaprava Nath (Indian Institute of Technology Kanpur)
Garima Shakya (Indian Institute of Technology Kanpur)

Your 2 is My 1, Your 3 is My 9: Handling Arbitrary Miscalibrations in Ratings (Page 864)
Jingyan Wang (Carnegie Mellon University)
Nihar B. Shah (Carnegie Mellon University)

(Return to Top)

Session: 3E: Game Theory 2

On the Performance of Stable Outcomes in Modified Fractional Hedonic Games with Egalitarian Social Welfare (Page 873)
Gianpiero Monaco (University of L'Aquila)
Luca Moscardelli (University of Chieti-Pescara)
Yllka Velaj (CWI Amsterdam)

Testing Individual-Based Stability Properties in Graphical Hedonic Games (Page 882)
Hendrik Fichtenberger (TU Dortmund University)
Amer Krivošija (TU Dortmund University)
Anja Rey (TU Dortmund University)

Stability in FEN-Hedonic Games for Single-Player Deviations (Page 891)
Anna Maria Kerkmann (Heinrich-Heine-Universität Düsseldorf)
Jörg Rothe (Heinrich-Heine-Universität Düsseldorf)

Efficiency, Sequenceability and Deal-Optimality in Fair Division of Indivisible Goods (Page 900)
Aurélie Beynier (LIP6, Sorbonne Université)
Sylvain Bouveret (Grenoble INP - University Grenoble-Alpes LIG)
Michel Lemaître (Formerly ONERA)
Nicolas Maudet (LIP6, Sorbonne Université)
Simon Rey (CNRS, ENS Paris-Saclay)
Parham Shams (LIP6, Sorbonne Université)

Computing Optimal Ex Ante Correlated Equilibria in Two-Player Sequential Games (Page 909)
Andrea Celli (Politecnico di Milano)
Stefano Coniglio (University of Southampton)
Nicola Gatti (Politecnico di Milano)

Efficient Allocation of Free Stuff (Page 918)
Yossi Azar (Tel Aviv University)
Allan Borodin (University of Toronto)
Michal Feldman (Tel Aviv University)
Amos Fiat (Tel Aviv University)
Kineret Segal (Tel Aviv University)

(Return to Top)

Session: 3F: Logics for Agents

A Representation Theorem for Reasoning in First-Order Multi-Agent Knowledge Bases (Page 926)
Christoph Schwering (The University of New South Wales)
Maurice Pagnucco (The University of New South Wales)

Convergence of Multi-Agent Learning with a Finite Step Size in General-Sum Games (Page 935)
Xinliang Song (Tsinghua University)
Tonghan Wang (Tsinghua University)
Chongjie Zhang (Tsinghua University)

Decision Procedures for Epistemic Logic Exploiting Belief Bases (Page 944)
Emiliano Lorini (IRIT-CNRS, Toulouse University)
Fabian Romero (IRIT, Toulouse University)

Groups Versus Coalitions: On the Relative Expressivity of GAL and CAL (Page 953)
Tim French (The University of Western Australia)
Rustam Galimullin (University of Nottingham)
Hans van Ditmarsch (LORIA, CNRS, University of Lorraine)
Natasha Alechina (University of Nottingham)

Natural Strategic Ability under Imperfect Information (Page 962)
Wojciech Jamroga (Polish Academy of Sciences)
Vadim Malvone (Université d’Evry)
Aniello Murano (Universitá degli studi di Napoli Federico II"")

Reasoning about Changes of Observational Power in Logics of Knowledge and Time (Page 971)
Aurèle Barrière (ENS Rennes)
Bastien Maubert (Università degli Studi di Napoli)
Aniello Murano (University of Napoli Federico II)
Sasha Rubin (University of Naples)

(Return to Top)

Session: 4A: Learning Agent Capabilities

A Cooperative Multi-Agent Reinforcement Learning Framework for Resource Balancing in Complex Logistics Network (Page 980)
Xihan Li (Peking University)
Jia Zhang (Microsoft Research Asia)
Jiang Bian (Microsoft Research Asia)
Yunhai Tong (Peking University)
Tie-Yan Liu (Microsoft Research Asia)

Context-Aware Policy Reuse (Page 989)
Siyuan Li (Tsinghua University)
Fangda Gu (Tsinghua University)
Guangxiang Zhu (Tsinghua University)
Chongjie Zhang (Tsinghua University)

Playing Atari with Six Neurons (Page 998)
Giuseppe Cuccu (University of Fribourg)
Julian Togelius (New York University)
Philippe Cudré-Mauroux (University of Fribourg)

PLOTS: Procedure Learning from Observations using subTask Structure (Page 1007)
Tong Mu (Stanford University)
Karan Goel (Stanford University)
Emma Brunskill (Stanford University)

Reducing Sampling Error in Policy Gradient Learning (Page 1016)
Josiah P. Hanna (The University of Texas at Austin)
Peter Stone (The University of Texas at Austin)

TBQ(σ): Improving Efficiency of Trace Utilization for Off-Policy Reinforcement Learning (Page 1025)
Longxiang Shi (Zhejiang University)
Shijian Li (Zhejiang University)
Longbing Cao (University of Technology Sydney)
Long Yang (Zhejiang University)
Gang Pan (Zhejiang University)

(Return to Top)

Session: 4B: Multimodal Interaction

A Grounded Interaction Protocol for Explainable Artificial Intelligence (Page 1033)
Prashan Madumal (University of Melbourne)
Tim Miller (University of Melbourne)
Liz Sonenberg (University of Melbourne)
Frank Vetere (University of Melbourne)

Community Regularization of Visually-Grounded Dialog (Page 1042)
Akshat Agarwal (Carnegie Mellon University)
Swaminathan Gurumurthy (Carnegie Mellon University)
Vasu Sharma (Carnegie Mellon University)
Mike Lewis (University of Pittsburgh)
Katia Sycara (Carnegie Mellon University)

What If I Speak Now? A Decision-Theoretic Approach to Personality-Based Turn-Taking (Page 1051)
Kathrin Janowski (University of Augsburg)
Elisabeth André (University of Augsburg)

Exploring Improvisational Approaches to Social Knowledge Acquisition (Page 1060)
Dan Feng (Northeastern University)
Elin Carstensdottir (Northeastern University)
Magy Seif El-Nasr (Northeastern University)
Stacy Marsella (University of Glasgow)

Protagonist vs Antagonist PROVANT: Narrative Generation as Counter Planning: Socially Interactive Agents Track (Page 1069)
Julie Porteous (RMIT University)
Alan Lindsay (University of Huddersfield)

Explainable Agents and Robots: Results from a Systematic Literature Review: Robotics Track (Page 1078)
Sule Anjomshoae (Umeå University)
Amro Najjar (Umea University)
Davide Calvaresi (University of Applied Sciences Western Switzerland (HES-SO))
Kary Främling (Umeå University)

(Return to Top)

Session: 4C: Deep Learning

Improved Cooperative Multi-agent Reinforcement Learning Algorithm Augmented by Mixing Demonstrations from Centralized Policy (Page 1089)
Hyun-Rok Lee (Korea Advanced Institute of Science & Technology)
Taesik Lee (Korea Advanced Institute of Science & Technology)

Malthusian Reinforcement Learning (Page 1099)
Joel Z. Leibo (DeepMind)
Julien Perolat (DeepMind)
Edward Hughes (DeepMind)
Steven Wheelwright (DeepMind)
Adam H. Marblestone (DeepMind)
Edgar Duéñez-Guzmán (DeepMind)
Peter Sunehag (DeepMind)
Iain Dunning (DeepMind)
Thore Graepel (DeepMind)

Modelling the Dynamic Joint Policy of Teammates with Attention Multi-agent DDPG (Page 1108)
Hangyu Mao (Peking University)
Zhengchao Zhang (Peking University)
Zhen Xiao (Peking University)
Zhibo Gong (Huawei Technologies Co., Ltd.)

Observational Learning by Reinforcement Learning (Page 1117)
Diana Borsa (DeepMind)
Nicolas Heess (DeepMind)
Bilal Piot (DeepMind)
Siqi Liu (DeepMind)
Leonard Hasenclever (DeepMind)
Remi Munos (DeepMind)
Olivier Pietquin (Google Brain)

Online Abstraction with MDP Homomorphisms for Deep Learning (Page 1125)
Ondrej Biza (Czech Technical University)
Robert Platt (Northeastern University)

The Body is Not a Given: Joint Agent Policy Learning and Morphology Evolution (Page 1134)
Dylan Banarse (DeepMind)
Yoram Bachrach (DeepMind)
Siqi Liu (DeepMind)
Guy Lever (DeepMind)
Nicolas Heess (DeepMind)
Chrisantha Fernando (DeepMind)
Pushmeet Kohli (Deepmind)
Thore Graepel (DeepMind)

(Return to Top)

Session: 4D: Robotics

Information Gathering in Decentralized POMDPs by Policy Graph Improvement (Page 1143)
Mikko Lauri (University of Hamburg)
Joni Pajarinen (TU Darmstadt)
Jan Peters (TU Darmstadt)

Task and Path Planning for Multi-Agent Pickup and Delivery (Page 1152)
Minghua Liu (Tsinghua University)
Hang Ma (University of Southern California)
Jiaoyang Li (University of Southern California)
Sven Koenig (University of Southern California)

Fully Convolutional One-Shot Object Segmentation for Industrial Robotics (Page 1161)
Benjamin Schnieders (University of Liverpool)
Shan Luo (University of Liverpool)
Gregory Palmer (University of Liverpool)
Karl Tuyls (University of Liverpool)

Online Inverse Reinforcement Learning Under Occlusion (Page 1170)
Saurabh Arora (University of Georgia)
Prashant Doshi (University of Georgia)
Bikramjit Banerjee (University of Southern Mississippi)

Patrol Scheduling Against Adversaries with Varying Attack Durations (Page 1179)
Hao-Tsung Yang (Stony Brook University)
Shih-Yu Tsai (Stony Brook University)
Kin Sum Liu (Stony Brook University)
Shan Lin (Stony Brook University)
Jie Gao (Stony Brook University)

Optimal Online Coverage Path Planning with Energy Constraints (Page 1189)
Gokarna Sharma (Kent State University)
Ayan Dutta (University of North Florida)
Jong-Hoon Kim (Kent State University)

(Return to Top)

Session: 4E: Game Theory 3

Cooperative Concurrent Games (Page 1198)
Julian Gutierrez (University of Oxford)
Sarit Kraus (Bar-Ilan University)
Michael Wooldridge (University of Oxford)

Maximizing the Spread of an Opinion when Tertium Datur Est (Page 1207)
Vincenzo Auletta (University of Salerno)
Diodato Ferraioli (University of Salerno)
Valeria Fionda (University of Calabria)
Gianluigi Greco (University of Calabria)

Obtaining Costly Unverifiable Valuations from a Single Agent (Page 1216)
Erel Segal-Halevi (Ariel University)
Shani Alkoby (University of Texas at Austin)
Tomer Sharbaf (Israel Ministry of Finance)
David Sarne (Bar-Ilan University)

Tracing Equilibrium in Dynamic Markets via Distributed Adaptation (Page 1225)
Yun Kuen Cheung (Singapore University of Technology and Design)
Martin Hoefer (Goethe University Frankfurt/Main)
Paresh Nakhe (Goethe University Frankfurt/Main)

Truthfulness on a Budget: Trading Money for Approximation through Monitoring (Page 1234)
Paolo Serafino (University of Oxford)
Carmine Ventre (University of Essex)
Angelina Vidali (University of Athens)

Well-behaved Online Load Balancing Against Strategic Jobs (Page 1243)
Bo Li (Stony Brook University)
Minming Li (City University of Hong Kong)
Xiaowei Wu (City University of Hong Kong & University of Vienna)

(Return to Top)

Session: 4F: Communication and Argumentation 1

Argumentation-based Negotiation with Incomplete Opponent Profiles (Page 1252)
Yannis Dimopoulos (University of Cyprus)
Jean-Guy Mailly (Paris Descartes University)
Pavlos Moraitis (Paris Descartes University)

Extracting Dialogical Explanations for Review Aggregations with Argumentative Dialogical Agents (Page 1261)
Oana Cocarascu (Imperial College London)
Antonio Rago (Imperial College London)
Francesca Toni (Imperial College London)

Gradual Semantics Accounting for Varied-Strength Attacks (Page 1270)
Leila Amgoud (CNRS - IRIT)
Dragan Doder (Toulouse University – IRIT)

On an Argument-centric Persuasion Framework (Page 1279)
Yakoub Salhi (CRIL, U. Artois & CNRS)

Single Transferable Vote: Incomplete Knowledge and Communication Issues (Page 1288)
Manel Ayadi (Université de Tunis & Université Paris Dauphine France)
Nahla Ben Amor (Université de Tunis)
Jérôme Lang (Université Paris-Dauphine)
Dominik Peters (University of Oxford)

Learning Plans by Acquiring Grounded Linguistic Meanings from Corrections (Page 1297)
Mattias Appelgren (The University of Edinburgh)
Alex Lascarides (University of Edinburgh)

(Return to Top)

Session: 5A: Learning Agents

A New Concept of Convex based Multiple Neural Networks Structure (Page 1306)
Yu Wang (Samsung Research America)
Yue Deng (Samsung Research America)
Yilin Shen (Samsung Research America)
Hongxia Jin (Samsung Research America)

Independent Generative Adversarial Self-Imitation Learning in Cooperative Multiagent Systems (Page 1315)
Xiaotian Hao (Tianjin University)
Weixun Wang (Tianjin University)
Jianye Hao (Tianjin University)
Yaodong Yang (Tianjin University)

Bandit Learning with Biased Human Feedback (Page 1324)
Wei Tang (Washington University in St. Louis)
Chien-Ju Ho (Washington University in St. Louis)

Robot Learning by Collaborative Network Training: A Self-Supervised Method using Ranking (Page 1333)
Mason Bretan (Samsung Research America)
Sageev Oore (Dalhousie University & Vector Institute)
Siddharth Sanan (Samsung Research America)
Larry Heck (Samsung Research America)

(Return to Top)

Session: 5B: Human-Robot interaction

Using Causal Analysis to Learn Specifications from Task Demonstrations (Page 1341)
Daniel Angelov (The University of Edinburgh)
Yordan Hristov (The University of Edinburgh)
Subramanian Ramamoorthy (The University of Edinburgh)

Human-guided Trajectory Adaptation for Tool Transfer (Page 1350)
Tesca Fitzgerald (Georgia Institute of Technology)
Elaine Short (University of Texas at Austin)
Ashok Goel (Georgia Institute of Technology)
Andrea Thomaz (University of Texas at Austin)

Distributed Heterogeneous Robot-Human Teams: Robotics Track (Page 1359)
S M Al Mahi (Oklahoma State University)
Kyungho Nam (Oklahoma State University)
Christopher Crick (Oklahoma State University)

Discriminatively Learning Inverse Optimal Control Models for Predicting Human Intentions (Page 1368)
Sanket Gaurav (University of Illinois at Chicago)
Brian Ziebart (University of Illinois at Chicago)

(Return to Top)

Session: 5C: Industrial Applications Track

Fraud Regulating Policy for E-Commerce via Constrained Contextual Bandits (Page 1377)
Zehong Hu (Alibaba Group)
Zhen Wang (Alibaba Group)
Zhao Li (Alibaba Group)
Shichang Hu (Alibaba Group)
Shasha Ruan (Alibaba Group)
Jie Zhang (Nanyang Technological University)

A Multi-task Selected Learning Approach for Solving 3D Flexible Bin Packing Problem (Page 1386)
Lu Duan (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Haoyuan Hu (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Yu Qian (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Yu Gong (Search Algorithm Team, Alibaba Group)
Xiaodong Zhang (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Jiangwen Wei (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Yinghui Xu (Zhejiang Cainiao Supply Chain Management Co., Ltd)

Can Sophisticated Dispatching Strategy Acquired by Reinforcement Learning?: A Case Study in Dynamic Courier Dispatching System (Page 1395)
Yujie Chen (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Yu Qian (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Yichen Yao (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Zili Wu (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Rongqi Li (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Yinzhi Zhou (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Haoyuan Hu (Zhejiang Cainiao Supply Chain Management Co., Ltd)
Yinghui Xu (Zhejiang Cainiao Supply Chain Management Co., Ltd)

FASTER: Fusion AnalyticS for public Transport Event Response (Page 1404)
Sebastien Blandin (IBM Research)
Laura Wynter (IBM Research)
Hasan Poonawala (IBM Research)
Sean Laguna (IBM Research)
Basile Dura (Ecole Polytechnique)

(Return to Top)

Session: 5D: Social Choice Theory 3

Algorithms for Gerrymandering over Graphs (Page 1413)
Takehiro Ito (Tohoku University)
Naoyuki Kamiyama (Kyushu University & JST, PRESTO)
Yusuke Kobayashi (Kyoto University)
Yoshio Okamoto (University of Electro-Communications & RIKEN AIP)

Modeling People's Voting Behavior with Poll Information (Page 1422)
Roy Fairstein (Ben Gurion University of the Negev)
Adam Lauz (Ben Gurion University of the Negev)
Reshef Meir (Technion, Israel Institute of Technology)
Kobi Gal (Ben-Gurion University of the Negev & University of Edinburgh)

Fall if it Lifts your Teammate: A Novel Type of Candidate Manipulation (Page 1431)
Justin Kruger (Paris Dauphine University and CNRS LAMSADE)
Sebastian Schneckenburger (University of Tuebingen)

How Hard Is It to Control a Group? (Page 1440)
Yongjie Yang (Saarland University)
Dinko Dimitrov (Saarland University)

(Return to Top)

Session: 5E: Auctions and Mechanism Design

Facility Location Games with Externalities (Page 1443)
Minming Li (City University of Hong Kong & University of Hong Kong Shenzhen Research Institute)
Lili Mei (Caritas Institute of Higher Education)
Yi Xu (Xi'an University of Technology)
Guochuan Zhang (Zhejiang University)
Yingchao Zhao (Caritas Institute of Higher Education)

Manipulations-resistant Facility Location Mechanisms for ZV-line Graphs (Page 1452)
Ilan Nehama (Bar-Ilan University)
Taiki Todo (Kyushu University & RIKEN AIP)
Makoto Yokoo (Kyushu University & RIKEN AIP)

Heterogeneous Two-facility Location Games with Minimum Distance Requirement (Page 1461)
Lingjie Duan (Singapore University of Technology and Design)
Bo Li (Stony Brook University)
Minming Li (City University of Hong Kong)
Xinping Xu (Singapore University of Technology and Design)

Truthful Mechanisms for Location Games of Dual-Role Facilities (Page 1470)
Xujin Chen (Academy of Mathematics and Systems Science, Chinese Academy of Sciences)
Minming Li (City University of Hong Kong)
Changjun Wang (Beijing University of Technology)
Chenhao Wang (City University of Hong Kong)
Yingchao Zhao (Caritas Institute of Higher Education)

(Return to Top)

Session: 5F: Agent Cooperation 1

Balanced task allocation by partitioning the multiple traveling salesperson problem (Page 1479)
Isaac Vandermeulen (The University of Sheffield)
Roderich Groß (The University of Sheffield)
Andreas Kolling (iRobot Corporation)

Distributed Environmental Modeling and Adaptive Sampling for Multi-Robot Sensor Coverage (Page 1488)
Wenhao Luo (Carnegie Mellon University)
Changjoo Nam (Korea Institute of Science and Technology)
George Kantor (Carnegie Mellon University)
Katia Sycara (Carnegie Mellon University)

Graph Based Optimization for Multiagent Cooperation (Page 1497)
Arambam James Singh (Singapore Management University)
Akshat Kumar (Singapore Management University)

PT-ISABB: A Hybrid Tree-based Complete Algorithm to Solve Asymmetric Distributed Constraint Optimization Problems (Page 1506)
Yanchen Deng (Chongqing University)
Ziyu Chen (Chongqing University)
Dingding Chen (Chongqing University)
Xingqiong Jiang (Chongqing University)
Qiang Li (Chongqing University)

(Return to Top)

Session: 5G: Networks

Adversarial Coordination on Social Networks (Page 1515)
Chen Hajaj (Ariel University)
Sixie Yu (Washington University)
Zlatko Joveski (Vanderbilt University)
Yifan Guo (Capital One)
Yevgeniy Vorobeychik (Washington University)

Group Segregation in Social Networks (Page 1524)
Dominic Aits (Imperial College)
Alexander Carver (Imperial College)
Paolo Turrini (University of Warwick)

A Context-aware Convention Formation Framework for Large-Scale Networks (Page 1533)
Mohammad Rashedul Hasan (University of Nebraska-Lincoln)
Anita Raja (Cooper Union)
Ana Bazzan (Universidade Federal do Rio Grande do Sul)

An Agent Model Based on Open Linked Data for Building Internet of Agents Ecosystems (Page 1536)
Pablo Pico-Valencia (Pontifical Catholic University of Ecuador, Esmeraldas)
Juan A. Holgado-Terriza (University of Granada)
José Senso (University of Granada)

(Return to Top)

Session: 6A: Agent-Based Simulation

Marginal Cost Pricing with a Fixed Error Factor in Traffic Networks (Page 1539)
Guni Sharon (Texas A&M University)
Stephen D. Boyles (The University of Texas at Austin)
Shani Alkoby (The University of Texas at Austin)
Peter Stone (The University of Texas at Austin)

Microscopic Traffic Simulation by Cooperative Multi-agent Deep Reinforcement Learning (Page 1547)
Giulio Bacchiani (VisLab & University of Parma)
Daniele Molinari (VisLab)
Marco Patander (VisLab)

Outcome-based Partner Selection in Collective Risk Dilemmas (Page 1556)
Fernando P. Santos (Princeton University)
Samuel F. Mascarenhas (INESC-ID & Instituto Superior Tecnico, Universidade Lisboa)
Francisco C. Santos (INESC-ID & Instituto Superior Tecnico, Universidade Lisboa)
Filipa Correia (INESC-ID & Instituto Superior Tecnico, Universidade Lisboa)
Samuel Gomes (INESC-ID & Instituto Superior Tecnico, Universidade Lisboa)
Ana Paiva (INESC-ID & Instituto Superior Tecnico, Universidade Lisboa)

Safe Policy Search Using Gaussian Process Models (Page 1565)
Kyriakos Polymenakos (University of Oxford)
Alessandro Abate (University of Oxford)
Stephen Roberts (University of Oxford)

(Return to Top)

Session: 6B: Auctions and Mechanism Design

Obviously Strategyproof Mechanisms without Money for Scheduling (Page 1574)
Maria Kyropoulou (University of Essex)
Carmine Ventre (University of Essex)

Revenue Maximization with Imprecise Distribution (Page 1582)
Yingkai Li (Northwestern University)
Pinyan Lu (Shanghai University of Finance and Economics)
Haoran Ye (Shanghai Jiao Tong University)

Buyer Signaling Games in Auctions (Page 1591)
Weiran Shen (IIIS, Tsinghua University)
Pingzhong Tang (IIIS, Tsinghua University)
Yulong Zeng (IIIS, Tsinghua University)

Forecast-Based Mechanisms for Demand Response (Page 1600)
Georgios Methenitis (Centrum Wiskunde & Informatica (CWI))
Michael Kaisers (Centrum Wiskunde & Informatica (CWI))
Han La Poutre (Centrum Wiskunde & Informatica (CWI))

(Return to Top)

Session: 6C: Engineering Multiagent Systems 2

Runtime Revision of Norms and Sanctions based on Agent Preferences (Page 1609)
Davide Dell'Anna (Utrecht University)
Mehdi Dastani (Utrecht University)
Fabiano Dalpiaz (Utrecht University)

Effective Collective Summarisation of Distributed Data in Mobile Multi-Agent Systems (Page 1618)
Giorgio Audrito (University of Torino)
Sergio Bergamini (University of Torino)
Ferruccio Damiani (University of Torino)
Mirko Viroli (University of Bologna)

Unsupervised Role Discovery Using Temporal Observations of Agents (Page 1627)
Andrew Silva (Georgia Institute of Technology)
Sonia Chernova (Georgia Institute of Technology)

The Matrix: An Agent-Based Modeling Framework for Data Intensive Simulations (Page 1635)
Parantapa Bhattacharya (University of Virginia)
Saliya Ekanayake (Lawrence Berkeley National Laboratory)
Chris J. Kuhlman (University of Virginia)
Christian Lebiere (Carnegie Mellon University)
Don Morrison (Carnegie Mellon University)
Samarth Swarup (University of Virginia)
Mandy L. Wilson (University of Virginia)
Mark G. Orr (University of Virginia)

(Return to Top)

Session: 6D: Blue Sky

Trusted AI and the Contribution of Trust Modeling in Multiagent Systems (Page 1644)
Robin Cohen (University of Waterloo)
Mike Schaekermann (University of Waterloo)
Sihao Liu (University of Waterloo)
Michael Cormier (University of Waterloo)

Between the Megalopolis and the Deep Blue Sky: Challenges of Transport with UAVs in Future Smart Cities: Blue Sky Ideas Track (Page 1649)
Yazan Mualla (CIAD, University Bourgogne Franche-Comté, UTBM)
Amro Najjar (Umeå University)
Stéphane Galland (CIAD, University Bourgogne Franche-Comté, UTBM)
Christophe Nicolle (CIAD, University Bourgogne Franche-Comté, UB)
Igor Haman Tchappi (University of Ngaoundere)
Ansar-Ul-Haque Yasar (Transportation Research Institute (IMOB), Hasselt University)
Kary Främling (Umeå University)

Beyond Autonomy: The Self and Life of Social Agents: Blue Sky Ideas Track (Page 1654)
Budhitama Subagdja (Nanyang Technological University)
Ah-Hwee Tan (Nanyang Technological University)

A Decade in Hindsight: The Missing Bridge Between Multi-Agent Systems and the World Wide Web (Page 1659)
Andrei Ciortea (University of St. Gallen & Inria, Université Côte d'Azur, CNRS)
Simon Mayer (University of St. Gallen & ETH Zürich)
Fabien Gandon (Inria, Université Côte d'Azur, CNRS)
Olivier Boissier (MINES Saint-Étienne, CNRS)
Alessandro Ricci (University of Bologna)
Antoine Zimmermann (MINES Saint-Étienne, CNRS)

Stream Reasoning Agents: Blue Sky Ideas Track (Page 1664)
Riccardo Tommasini (Politecnico di Milano)
Davide Calvaresi (University of Applied Sciences & Arts Western Switzerland HES-SO)
Jean-Paul Calbimonte (University of Applied Sciences & Arts Western Switzerland HES-SO)

(Return to Top)

Session: 6E: Agent Cooperation 2

Online Resource Allocation with Matching Constraints (Page 1681)
John P. Dickerson (University of Maryland)
Karthik Abinav Sankararaman (University of Maryland College Park)
Kanthi Kiran Sarpatwar (IBM Research AI)
Aravind Srinivasan (University of Maryland, College Park)
Kun-Lung Wu (IBM Research AI)
Pan Xu (University of Maryland, College Park)

Type Checking for Protocol Role Enactments via Commitments (Page 1690)
Matteo Baldoni (Università degli Studi di Torino)
Cristina Baroglio (Università desgli Studi di Torino)
Federico Capuzzimati (Università desgli Studi di Torino)
Roberto Micalizio (Università desgli Studi di Torino)

Multi-unit Budget Feasible Mechanisms for Cellular Traffic Offloading (Page 1693)
Jun Wu (Nanjing University)
Yuan Zhang (Nanjing University)
Yu Qiao (Nanjing University cs)
Lei Zhang (Nanjing University)
Chongjun Wang (Nanjing University)
Junyuan Xie (Nanjing University)

Computing Optimal Coalition Structures in Polynomial Time (Page 1702)
Shaheen Fatima (Loughborough University)
Michael Wooldridge (Oxford University)

(Return to Top)

Session: 6F: Communication and Argumentation 2

A Fully Rational Argumentation System for Preordered Defeasible Rules (Page 1704)
Jesse Heyninck (Ruhr-University Bochum)
Christian Straßer (Ruhr-University Bochum)

Complexity Results and Algorithms for Bipolar Argumentation (Page 1713)
Amin Karamlou (Imperial College London)
Kristijonas Čyras (Imperial College London)
Francesca Toni (Imperial College London)

Extending Modular Semantics for Bipolar Weighted Argumentation (Page 1722)
Nico Potyka (University of Osnabrueck)

Resolving Conflicts in Clinical Guidelines using Argumentation (Page 1731)
Kristijonas čyras (Imperial College London)
Tiago Oliveira (National Institute of Informatics)

Session: 6G: Planning & Learning

Comparative Criteria for Partially Observable Contingent Planning: JAAMAS Track (Page 1740)
Dorin Shmaryahu (Ben Gurion University of the Negev)
Jörg Hoffmann (Saarland University)
Guy Shani (Ben Gurion University of the Negev)

Attack-Resilient Connectivity Game for UAV Networks using Generative Adversarial Learning (Page 1743)
Bo Yang (Institute of Computing Technology, Chinese Academy of Sciences)
Min Liu (Institute of Computing Technology, Chinese Academy of Sciences)

The Impact of Agent Definitions and Interactions on Multiagent Learning for Coordination (Page 1752)
Jen Jen Chung (Eidgenössische Technische Hochschule Zürich)
Damjan Miklić (RoMb Technologies d.o.o.)
Lorenzo Sabattini (University of Modena and Reggio Emilia)
Kagan Tumer (Oregon State University)
Roland Siegwart (Eidgenössische Technische Hochschule Zürich)

An Agent-Based Model of the Emergence and Evolution of a Language System for Boolean Coordination: JAAMAS Track (Page 1761)
Josefina Sierra-Santibanez (Technical University of Catalonia)

(Return to Top)

Extended Abstracts

Classification of Contractual Conflicts via Learning of Semantic Representations (Page 1764)
João Paulo Aires (Pontifical Catholic University of Rio Grande do Sul)
Roger Granada (Pontifical Catholic University of Rio Grande do Sul)
Juarez Monteiro (Pontifical Catholic University of Rio Grande do Sul)
Rodrigo Coelho Barros (Pontifical Catholic University of Rio Grande do Sul)
Felipe Meneguzzi (Pontifical Catholic University of Rio Grande do Sul)

When to Stop for Safe Manipulation in Unstructured Environments? (Page 1767)
Abdullah Cihan Ak (Istanbul Technical University)
Arda Inceoglu (Istanbul Technical University)
Sanem Sariel (Istanbul Technical University)

Summary: Distributed Task Assignment and Path Planning with Limited Communication for Robot Teams (Page 1770)
Dario Albani (La Sapienza University of Rome)
Wolfgang Höenig (University of Southern California)
Nora Ayanian (University of Southern California)
Daniele Nardi (La Sapienza University of Rome)
Vito Trianni (ISTC - CNR)

Teaching Social Behavior through Human Reinforcement for Ad hoc Teamwork - The STAR Framework: Extended Abstract (Page 1773)
Shani Alkoby (University of Texas at Austin)
Avilash Rath (University of Texas at Austin)
Peter Stone (University of Texas at Austin)

Towards Decentralized Reinforcement Learning Architectures for Social Dilemmas (Page 1776)
Nicolas Anastassacos (The Alan Turing Institute and University College London)
Mirco Musolesi (The Alan Turing Institute and University College London)

(Return to Top)

Learning Simulation-Based Games from Data (Page 1778)
Enrique Areyan Viqueira (Brown University)
Amy Greenwald (Brown University)
Cyrus Cousins (Brown University)
Eli Upfal (Brown University)

Using Surrogate Models to Calibrate Agent-based Model Parameters Under Data Scarcity (Page 1781)
Priscilla Avegliano (IBM Research & University of São Paulo)
Jaime Simão Sichman (University of São Paulo)

The Multimodal Correction Detection Problem (Page 1784)
Amos Azaria (Ariel University)
Keren Nivasch (Ariel University)

Maxmin Share Fair Allocation of Indivisible Chores to Asymmetric Agents (Page 1787)
Haris Aziz (UNSW Sydney and Data61)
Hau Chan (University of Nebraska-Lincoln)
Bo Li (Stony Brook University)

Adaptive Multi-agent System for Situated Task Allocation (Page 1790)
Quentin Baert (Université de Lille)
Anne-Cécile Caron (Université de Lille)
Maxime Morge (Université de Lille)
Jean-Christophe Routier (Université de Lille)
Kostas Stathis (Royal Holloway, University of London)

Inverse Kinematics and Sensitivity Minimization of an n-Stack Stewart Platform (Page 1793)
David Balaban (University of Massachusetts, Amherst)
John Cooper (NASA Langley Research Center)
Erik Komendera (Virginia Tech)

Engineering Business Processes through Accountability and Agents (Page 1796)
Matteo Baldoni (Università desgli Studi di Torino)
Cristina Baroglio (Università desgli Studi di Torino)
Olivier Boissier (MINES Saint-Etienne)
Roberto Micalizio (Università desgli Studi di Torino)
Stefano Tedeschi (Università degli Studi di Torino)

High-Level Path Planning in Hostile Dynamic Environments (Page 1799)
Jacopo Banfi (Cornell University)
Mark Campbell (Cornell University)

Actor Based Simulation for Closed Loop Control of Supply Chain using Reinforcement Learning (Page 1802)
Souvik Barat (Tata Consultancy Services Research)
Harshad Khadilkar (Tata Consultancy Services Research)
Hardik Meisheri (Tata Consultancy Services Research)
Vinay Kulkarni (Tata Consultancy Services Research)
Vinita Baniwal (Tata Consultancy Services Research)
Prashant Kumar (Tata Consultancy Services Research)
Monika Gajrani (Tata Consultancy Services Research)

Attention-based Deep Reinforcement Learning for Multi-view Environments (Page 1805)
Elaheh Barati (Wayne State University)
Xuewen Chen (AIWAYS AUTO)
Zichun Zhong (Wayne State University)

Towards Predictive Execution Monitoring in BDI Recipes (Page 1808)
Mika Barkan (Bar-Ilan University)
Gal A. Kaminka (Bar-Ilan University)

Fair Division of Indivisible Goods Among Strategic Agents (Page 1811)
Siddharth Barman (Indian Institute of Science)
Ganesh Ghalme (Indian Institute of Science)
Shweta Jain (Indian Institute of Technology, Bhubhaneswar)
Pooja Kulkarni (University of Illinois, Urbana-Champaign)
Shivika Narang (Indian Institute of Science)

Manipulative Design of Scoring Systems (Page 1814)
Dorothea Baumeister (Heinrich-Heine-Universitaet Duesseldorf)
Tobias Hogrebe (Heinrich-Heine-Universität Düsseldorf)

A Social Choice Theoretic Perspective on Database Aggregation (Page 1817)
Francesco Belardinelli (Imperial College London & Université d’Evry)
Umberto Grandi (IRIT, University of Toulouse)

Verifying Strategic Abilities in Multi-agent Systems with Private Data-Sharing (Page 1820)
Francesco Belardinelli (Imperial College London & Université d’Evry)
Ioana Boureanu (University of Surrey)
Catalin Dima (Université Paris-Est Créteil)
Vadim Malvone (University of Evry)

A Property-based Testing Framework for Multi-Agent Systems (Page 1823)
Clara Benac Earle (Universidad Politecnica de Madrid)
Lars-Åke Fredlund (Universidad Politecnica de Madrid)

Training Cooperative Agents for Multi-Agent Reinforcement Learning (Page 1826)
Sushrut Bhalla (University of Waterloo)
Sriram G. Subramanian (University of Waterloo)
Mark Crowley (University of Waterloo)

A Truthful Online Mechanism for Allocating Fog Computing Resources (Page 1829)
Fan Bi (University of Southampton)
Sebastian Stein (University of Southampton)
Enrico Gerding (University of Southampton)
Nick Jennings (Imperial College London)
Tom La Porta (The Pennsylvania State University)

Fairness Through the Lens of Proportional Equality (Page 1832)
Arpita Biswas (Indian Institute of Science)
Suvam Mukherjee (Microsoft Research)

(Return to Top)

The DARPA SocialSim Challenge: Massive Multi-Agent Simulations of the Github Ecosystem (Page 1835)
James Blythe (University of Southern California)
Emilio Ferrara (University of Southern California)
Di Huang (University of Southern California)
Kristina Lerman (University of Southern California)
Goran Muric (University of Southern California)
Anna Sapienza (University of Southern California)
Alexey Tregubov (University of Southern California)
Diogo Pacheco (Indiana University)
John Bollenbacher (Indiana University)
Alessandro Flammini (Indiana University)
Pik-Mai Hui (Indiana University)
Filippo Menczer (Indiana University)

Broken Signals in Security Games: Coordinating Patrollers and Sensors in the Real World (Page 1838)
Elizabeth Bondi (University of Southern California)
Hoon Oh (Carnegie Mellon University)
Haifeng Xu (Harvard University)
Fei Fang (Carnegie Mellon University)
Bistra Dilkina (University of Southern California)
Milind Tambe (University of Southern California)

Preference-Based Fault Estimation in Autonomous Robots : Incompleteness and Meta-Diagnosis (Page 1841)
Valentin Bouziat (ONERA)
Xavier Pucel (ONERA)
Stéphanie Roussel (ONERA)
Louise Travé-Massuyès (LAAS-CNRS)

Regular Decision Processes: Modelling Dynamic Systems without Using Hidden Variables: Extended Abstrac (Page 1844)
Ronen I. Brafman (Ben Gurion University of the Negev)
Giuseppe De Giacomo (Sapienza Università di Roma)

The Rise and Fall of Complex Family Structures: Coalition Formation, Stability, and Power Struggle (Page 1847)
Angelina Brilliantova (Rochester Institute of Technology)
Anton Pletenev (Lomonosov Moscow State University)
Hadi Hosseini (Rochester Institute of Technology)

MCTS-based Automated Negotiation Agent (Page 1850)
Cédric L. R. Buron (Thales Research and Technology)
Zahia Guessoum (LIP6, Sorbonne Université)
Sylvain Ductor (Universidade Estadual do Ceará)

(Return to Top)

An Urgency-Dependent Quorum Sensing Algorithm for N-Site Selection in Autonomous Swarms (Page 1853)
Grace Cai (Montgomery Blair High School)
Don Sofge (US Naval Research Laboratory)

Multinomial HMMs for Intent Recognition in Maritime Domains (Page 1856)
Logan Carlson (University of Nevada, Reno)
Dalton Navalta (University of Nevada, Reno)
Monica Nicolescu (University of Nevada, Reno)
Mircea Nicolescu (University of Nevada, Reno)
Gail Woodward (NASA Jet Propulsion Laboratory)

Domain Adaptation for Reinforcement Learning on the Atari (Page 1859)
Thomas Carr (Aston University)
Maria Chli (Aston University)
George Vogiatzis (Aston University)

The Representational Capacity of Action-Value Networks for Multi-Agent Reinforcement Learning (Page 1862)
Jacopo Castellini (University of Liverpool)
Frans A. Oliehoek (Delft University of Technology)
Rahul Savani (University of Liverpool)
Shimon Whiteson (University of Oxford)

Cooperative Multi-Agent Deep Reinforcement Learning in Soccer Domains (Page 1865)
Jim Martin Catacora Ocana (Sapienza University of Rome)
Francesco Riccio (Sapienza University of Rome)
Roberto Capobianco (Sapienza University of Rome)
Daniele Nardi (Sapienza University of Rome)

Personality-Based Representations of Imperfect-Recall Games (Page 1868)
Andrea Celli (Politecnico di Milano)
Giulia Romano (Politecnico di Milano)
Nicola Gatti (Politecnico di Milano)

Maximin-Aware Allocations of Indivisible Goods (Page 1871)
Hau Chan (University of Nebraska-Lincoln)
Jing Chen (Stony Brook University)
Bo Li (Stony Brook University)
Xiaowei Wu (University of Vienna)

Reachability and Coverage Planning for Connected Agents (Page 1874)
Tristan Charrier (Univ Rennes, CNRS, IRISA)
Arthur Queffelec (Univ Rennes, CNRS, IRISA)
Ocan Sankur (Univ Rennes, Inria, CNRS, IRISA)
François Schwarzentruber (Univ Rennes, CNRS, IRISA)

Collaborative Reinforcement Learning Model for Sustainability of Cooperation in Sequential Social Dilemmas (Page 1877)
Ritwik Chaudhuri (IBM Research, India)
Kushal Mukherjee (IBM Research, India)
Ramasuri Narayanam (IBM Research, India)
Rohith Dwarakanath Vallam (IBM Research, India)
Ayush Kumar (IIT Delhi)
Antriksh Mathur (IIT Delhi)
Shweta Garg (IBM Research, India)
Sudhanshu Singh (IBM Research, India)
Gyana Parija (IBM Research, India)

Reinforcement Learning with Derivative-Free Exploration (Page 1880)
Xiong-Hui Chen (Nanjing University)
Yang Yu (Nanjing University)

(Return to Top)

MARL-PPS: Multi-agent Reinforcement Learning with Periodic Parameter Sharing (Page 1883)
Safa Cicek (University of California, Los Angeles)
Alireza Nakhaei (Honda Research Institute)
Stefano Soatto (University of California, Los Angeles)
Kikuo Fujimura (Honda Research Institute)

Power Indices for Team Reformation Planning Under Uncertainty (Page 1886)
Jonathan Cohen (GREYC-CNRS Lab, University of Caen Normandy)
Abdel-Illah Mouaddib (GREYC-CNRS Lab, University of Caen Normandy)

Stability of Human-Inspired Agent Societies (Page 1889)
Joe Collenette (University of Liverpool)
Katie Atkinson (University of Liverpool)
Daan Bloembergen (Centrum Wiskunde & Informatica (CWI))
Karl Tuyls (University of Liverpool)

Warning Time: Optimizing Strategic Signaling for Security Against Boundedly Rational Adversaries (Page 1892)
Sarah Cooney (University of Southern California)
Phebe Vayanos (University of Southern California)
Thanh H. Nguyen (University of Oregon Computer and Information Science)
Cleotilde Gonzalez (Carnegie Mellon University)
Christian Lebiere (Carnegie Mellon University)
Edward A. Cranford (Carnegie Mellon University)
Milind Tambe (University of Southern California)

Vote For Me! Election Control via Social Influence in Arbitrary Scoring Rule Voting Systems (Page 1895)
Federico Corò (Gran Sasso Science Institute)
Emilio Cruciani (Gran Sasso Science Institute)
Gianlorenzo D'Angelo (Gran Sasso Science Institute)
Stefano Ponziani (Gran Sasso Science Institute)

Cooperating in Long-term Relationships with Time-Varying Structure (Page 1898)
Jacob W. Crandall (Brigham Young University)
Huy Pham (Brigham Young University)

Incorporating Social Practices in BDI Agent Systems (Page 1901)
Stephen Cranefield (University of Otago)
Frank Dignum (Umeå University)

Evidence Propagation and Consensus Formation in Noisy Environments (Page 1904)
Michael Crosscombe (University of Bristol)
Jonathan Lawry (University of Bristol)

Hybrid BiLSTM-Siamese Network for Relation Extraction (Page 1907)
Zeyuan Cui (Shandong University)
Li Pan (Shandong University)
Shijun Liu (Shandong University)

How to Get the Most from Goods Donated to Charities (Page 1910)
Christopher Culley (University of Southampton)
Ji Qi (University of Essex)
Carmine Ventre (University of Essex)

The Gift Exchange Game: Managing Opponent Actions (Page 1913)
Steven Damer (University of Minnesota)
Maria Gini (University of Minnesota)
Jeffrey S. Rosenschein (Hebrew University of Jerusalem)

A Truthful, Privacy-Preserving, Approximately Efficient Combinatorial Auction For Single-minded Bidders (Page 1916)
Sankarshan Damle (International Institute of Information Technology, Hyderabad)
Boi Faltings (Ecole Polytechnique Fedeŕalé de Lausanne)
Sujit Gujar (International Institute of Information Technology, Hyderabad)

Aggregating Citizen Preferences for Public Projects Through Civic Crowdfunding (Page 1919)
Sankarshan Damle (International Institute of Information Technology, Hyderabad)
Moin Hussain Moti (International Institute of Information Technology, Hyderabad)
Praphul Chandra (KoineArth)
Sujit Gujar (International Institute of Information Technology, Hyderabad)

Landmark Based Reward Shaping in Reinforcement Learning with Hidden States (Page 1922)
Alper Demir (Middle East Technical University)
Erkin Çilden (STM RF and Simulation Systems Directorate)
Faruk Polat (Middle East Technical University)

Local Distance Restricted Bribery in Voting (Page 1925)
Palash Dey (Indian Institute of Technology Kharagpur)

Delayed and Time-Variant Patrolling Strategies against Attackers with Local Observation Capabilities (Page 1928)
Carlos Diaz Alvarenga (University of California, Merced)
Nicola Basilico (University of Milan)
Stefano Carpin (University of California, Merced)

Actor-Critic Algorithms for Constrained Multi-agent Reinforcement Learning (Page 1931)
Raghuram Bharadwaj Diddigi (Indian Institute of Science)
Sai Koti Reddy Danda (IBM Research)
Prabuchandran Krithivasan Jayachandran (Amazon-IISc Postdoctoral Fellow)
Shalabh Bhatnagar (Indian Institute of Science)

The Imitation Game: Learned Reciprocity in Markov games (Page 1934)
Tom Eccles (DeepMind)
Edward Hughes (DeepMind)
János Kramár (DeepMind)
Steven Wheelwright (DeepMind)
Joel Z. Leibo (DeepMind)

Interpretable Automated Machine Learning in Maana™ Knowledge Platform (Page 1937)
Alexander Elkholy (Maana Inc.)
Fangkai Yang (Maana Inc.)
Steven Gustafson (Maana Inc.)

Improving Wind Power Forecasting through Cooperation: A Case-Study on Operating Farms (Page 1940)
Tanguy Esteoule (IRIT, University of Toulouse & meteo*swift)
Carole Bernon (IRIT, University of Toulouse)
Marie-Pierre Gleizes (IRIT, University of Toulouse)
Morgane Barthod (meteo*swift)

Optimising Worlds to Evaluate and Influence Reinforcement Learning Agents (Page 1943)
Richard Everett (University of Oxford)
Adam Cobb (University of Oxford)
Andrew Markham (University of Oxford)
Stephen Roberts (University of Oxford)

(Return to Top)

Proportional Representation in Elections: STV vs PAV (Page 1946)
Piotr Faliszewski (AGH University of Science and Technology)
Piotr Skowron (University of Warsaw)
Stanislaw Szufa (Jagiellonian University)
Nimrod Talmon (Ben-Gurion University)

From Hotelling to Load Balancing: Approximation and the Principle of Minimum Differentiation (Page 1949)
Matthias Feldotto (Paderborn University)
Pascal Lenzner (Hasso Plattner Institute & University of Potsdam)
Louise Molitor (Hasso Plattner Institute & University of Potsdam)
Alexander Skopalik (University of Twente)

Obvious Strategyproofness, Bounded Rationality and Approximation (Page 1952)
Diodato Ferraioli (University of Salerno)
Carmine Ventre (University of Essex)

On Enactability of Agent Interaction Protocols: Towards a Unified Approach (Page 1955)
Angelo Ferrando (University of Liverpool)
Michael Winikoff (University of Otago)
Stephen Cranefield (University of Otago)
Frank Dignum (Umeå University)
Viviana Mascardi (University of Genova)

Smart Targets to Avoid Observation in CTO Problem (Page 1958)
Thayanne França da Silva (Universidade Estadual do Ceará)
José Luis Alves Leite (Universidade Estadual do Ceará)
Raimundo Juracy Campos Ferro Junior (Universidade Estadual do Ceará)
Leonardo Ferreira da Costa (Universidade Estadual do Ceará)
Raphael Pinheiro de Souza (Universidade Estadual do Ceará)
João Pedro Bernardino Andrade (Universidade Estadual do Ceará)
Gustavo Augusto Lima de Campos (Universidade Estadual do Ceará)

Bayesian-DPOP for Continuous Distributed Constraint Optimization Problems (Page 1961)
Jeroen Fransman (Delft University of Technology)
Joris Sijs (Netherlands Organisation for Applied Scientific Research (TNO))
Henry Dol (Netherlands Organisation for Applied Scientific Research (TNO))
Erik Theunissen (Netherlands Defense Academy (NLDA))
Bart De Schutter (Delft University of Technology)

Dynamic Aleatoric Reasoning in Games of Bluffing and Chance (Page 1964)
Tim French (The University of Western Australia)
Andrew Gozzard (The University of Western Australia)
Mark Reynolds (The University of Western Australia)

Meta-learning for Predictive Knowledge Architectures: A Case Study Using TIDBD on a Sensor-rich Robotic Arm (Page 1967)
Johannes Güenther (University of Alberta)
Alex Kearney (University of Alberta)
Nadia M. Ady (University of Alberta)
Michael R. Dawson (University of Alberta)
Patrick M. Pilarski (University of Alberta)

Learning Behaviors from a Single Video Demonstration Using Human Feedback (Page 1970)
Sunil Gandhi (University of Maryland Baltimore County)
Tim Oates (University of Maryland Baltimore County)
Tinoosh Mohsenin (University of Maryland Baltimore County)
Nicholas R. Waytowich (US Army Research Laboratory)

A Compression-Inspired Framework for Macro Discovery (Page 1973)
Francisco M. Garcia (University of Massachusetts, Amherst)
Bruno C. da Silva (Federal University of Rio Grande do Sul)
Philip S. Thomas (University of Massachusetts, Amherst)

A Meta-MDP Approach to Exploration for Lifelong Reinforcement Learning (Page 1976)
Francisco M. Garcia (University of Massachusetts, Amherst)
Philip S. Thomas (University of Massachusetts, Amherst)

Role of Emotions in Perception of Humanness of Virtual Agents (Page 1979)
Moojan Ghafurian (University of Waterloo)
Neil Budnarain (University of Waterloo)
Jesse Hoey (University of Waterloo)

An Adaptable Self-Monitoring Framework for Complex Machines (Page 1982)
Leilani H. Gilpin (Massachusetts Institute of Technology)
Lalana Kagal (Massachusetts Institute of Technology)

(Return to Top)

Optimal Sequential Planning for Communicative Actions: A Bayesian Approach (Page 1985)
Piotr Gmytrasiewicz (University of Illinois at Chicago)
Sarit Adhikari (University of Illinois at Chicago)

Towards Accurate Deep-Sea Localization in Structured Environments based on Perception Quality Cues (Page 1988)
Arturo Gomez Chavez (Jacobs University Bremen gGmbH)
Qingwen Xu (ShanghaiTech University)
Christian A. Mueller (Jacobs University Bremen gGmbH)
Sören Schwertfeger (ShanghaiTech University)
Andreas Birk (Jacobs University Bremen gGmbH)

Applying Norms and Sanctions to Promote Cybersecurity Hygiene (Page 1991)
Shubham Goyal (Amazon)
Nirav Ajmeri (North Carolina State University)
Munindar P. Singh (North Carolina State University)

Credulous Acceptability, Poison Games and Modal Logic (Page 1994)
Davide Grossi (University of Groningen)
Simon Rey (Sorbonne Université, ENS Paris-Saclay)

Advice Replay Approach for Richer Knowledge Transfer in Teacher Student Framework (Page 1997)
Vaibhav Gupta (International Institute of Information Technology, Hyderabad)
Daksh Anand (International Institute of Information Technology, Hyderabad)
Praveen Paruchuri (International Institute of Information Technology, Hyderabad)
Balaraman Ravindran (Indian Institute of Technology, Madras)

Contest Manipulation for Improved Performance (Page 2000)
Michal Habani (Bar-Ilan University)
Priel Levy (Bar-Ilan University)
David Sarne (Bar-Ilan University)

A Homophily-Free Community Detection Framework for Trajectories with Delayed Responses (Page 2003)
Chung-Kyun Han (Singapore Management University)
Shih-Fen Cheng (Singapore Management University)
Pradeep Varakantham (Singapore Management University)

Multi-Agent Hierarchical Reinforcement Learning with Dynamic Termination (Page 2006)
Dongge Han (University of Oxford)
Wendelin Boehmer (University of Oxford)
Michael Wooldridge (University of Oxford)
Alex Rogers (University of Oxford)

Towards a Master Algorithm" for Forming Faster Conventions On Various Networks" (Page 2009)
Mohammad Rashedul Hasan (University of Nebraska-Lincoln)

Logically-Constrained Neural Fitted Q-iteration (Page 2012)
Mohammadhosein Hasanbeig (University of Oxford)
Alessandro Abate (University of Oxford)
Daniel Kroening (University of Oxford)

Social Power in Human-Robot Interaction: Towards More Persuasive Robots (Page 2015)
Mojgan Hashemian (INESC-ID & Universidade de Lisboa)
Ana Paiva (INESC-ID & Universidade de Lisboa)
Samuel Mascarenhas (INESC-ID & Universidade de Lisboa)
Pedro A. Santos (INESC-ID & Universidade de Lisboa)
Rui Prada (INESC-ID & Universidade de Lisboa)

Simple Contrapositive Assumption-Based Frameworks (Page 2018)
Jesse Heyninck (Ruhr University Bochum)
Ofer Arieli (The Academic College of Tel-Aviv)

To be Big Picture Thinker or Detail-Oriented? Utilizing Perceived Gist Information to Achieve Efficient Convention Emergence with Bilateralism and Multilateralism (Page 2021)
Shuyue Hu (The Chinese University of Hong Kong)
Chin-wing Leung (The Chinese University of Hong Kong)
Ho-fung Leung (The Chinese University of Hong Kong)
Jiamou Liu (The University of Auckland)

Optimal Trip-Vehicle Dispatch with Multi-Type Requests (Page 2024)
Taoan Huang (Tsinghua University)
Bohui Fang (Shanghai Jiao Tong University)
Hoon Oh (Carnegie Mellon University)
Xiaohui Bei (Nanyang Technological University)
Fei Fang (Carnegie Mellon University)

Robustness against Agent Failure in Hedonic Games (Page 2027)
Ayumi Igarashi (Kyushu University)
Kazunori Ota (Kyushu University)
Yuko Sakurai (National Institute of Advanced Industrial Science and Technology (AIST))
Makoto Yokoo (Kyushu University)

Learning Factored Markov Decision Processes with Unawareness (Page 2030)
Craig Innes (University of Edinburgh)
Alex Lascarides (University of Edinburgh)

Student-Project-Resource Matching-Allocation Problems: Two-Sided Matching Meets Resource Allocation (Page 2033)
Anisse Ismaili (RIKEN, Center for Advanced Intelligence Project AIP)
Kentaro Yahiro (Kyushu University)
Tomoaki Yamaguchi (Kyushu University)
Makoto Yokoo (Kyushu University)

Complexity and Approximations in Robust Coalition Formation via Max-Min k-Partitioning (Page 2036)
Anisse Ismaili (RIKEN AIP Center for Advanced Intelligence Project)
Noam Hazon (Ariel University)
Emi Watanabe (Kyushu University)
Makoto Yokoo (Kyushu University)
Sarit Kraus (Bar-Ilan University)

(Return to Top)

Avoiding Social Disappointment in Elections (Page 2039)
Mohammad Ali Javidian (University of South Carolina)
Pooyan Jamshidi (University of South Carolina)
Rasoul Ramezanian (Ferdowsi University Of Mashhad)

Deep Fictitious Play for Games with Continuous Action Spaces (Page 2042)
Nitin Kamra (University of Southern California)
Umang Gupta (University of Southern California)
Kai Wang (University of Southern California)
Fei Fang (Carnegie Mellon University)
Yan Liu (University of Southern California)
Milind Tambe (University of Southern California)

Stackelberg Equilibrium Approximation in General-Sum Extensive-Form Games with Double-Oracle Sampling Method (Page 2045)
Jan Karwowski (Warsaw University of Technology)
Jacek Mańdziuk (Warsaw University of Technology)

Meta-Strategy for Multi-Time Negotiation: A Multi-Armed Bandit Approach (Page 2048)
Ryohei Kawata (Tokyo University of Agriculture and Technology)
Katsuhide Fujita (Tokyo University of Agriculture and Technology)

The Complexity of the Possible Winner Problem with Partitioned Preferences (Page 2051)
Batya Kenig (University of Washington)

(Return to Top)

Memory based Multiagent One Shot Learning (Page 2054)
Shauharda Khadka (Oregon State University)
Connor Yates (Oregon State University)
Kagan Tumer (Oregon State University)

Dynamic and Intelligent Control of Autonomous Vehicles for Highway On-ramp Merge (Page 2057)
Zine el abidine Kherroubi (Groupe Renault)
Samir Aknine (University Claude Bernard Lyon 1 university)
Rebiha Bacha (Groupe Renault)

Removing the Target Network from Deep Q-Networks with the Mellowmax Operator (Page 2060)
Seungchan Kim (Brown University)
Kavosh Asadi (Brown University)
Michael Littman (Brown University)
George Konidaris (Brown University)

Recognising and Explaining Bidding Strategies in Negotiation Support Systems (Page 2063)
Vincent J. Koeman (Delft University of Technology)
Koen V. Hindriks (Delft University of Technology)
Jonathan Gratch (University of Southern California)
Catholijn M. Jonker (Delft University of Technology)

Bribery in Balanced Knockout Tournaments (Page 2066)
Christine Konicki (Massachusetts Institute of Technology)
Virginia Vassilevska Williams (Massachusetts Institute of Technology)

Multi-agent Path Planning with Non-constant Velocity Motion (Page 2069)
Ngai Meng Kou (Cainiao Smart Logistics Network Limited)
Cheng Peng (Cainiao Smart Logistics Network Limited)
Xiaowei Yan (Cainiao Smart Logistics Network Limited)
Zhiyuan Yang (Cainiao Smart Logistics Network Limited)
Heng Liu (Cainiao Smart Logistics Network Limited)
Kai Zhou (Cainiao Smart Logistics Network Limited)
Haibing Zhao (Cainiao Smart Logistics Network Limited)
Lijun Zhu (Cainiao Smart Logistics Network Limited)
Yinghui Xu (Cainiao Smart Logistics Network Limited)

On the Importance of Representations for Speech-Driven Gesture Generation (Page 2072)
Taras Kucherenko (KTH Royal Institute of Technology)
Dai Hasegawa (Hokkai Gakuen University)
Naoshi Kaneko (Aoyama Gakuin University)
Gustav Eje Henter (KTH Royal Institute of Technology)
Hedvig Kjellström (KTH Royal Institute of Technology)

Explicable Planning as Minimizing Distance from Expected Behavior (Page 2075)
Anagha Kulkarni (Arizona State University)
Yantian Zha (Arizona State University)
Tathagata Chakraborti (IBM Research AI)
Satya Gautam Vadlamudi (CreditVidya)
Yu Zhang (Arizona State University)
Subbarao Kambhampati (Arizona State University)

Active Learning with Gaussian Processes for High Throughput Phenotyping (Page 2078)
Sumit Kumar (Carnegie Mellon University)
Wenhao Luo (Carnegie Mellon University)
George Kantor (Carnegie Mellon University)
Katia Sycara (Carnegie Mellon University)

Toward Robust Policy Summarization (Page 2081)
Isaac Lage (Harvard University)
Daphna Lifschitz (Technion - Israel Institute of Technology)
Finale Doshi-Velez (Harvard University)
Ofra Amir (Technion - Israel Institute of Technology)

Long-term Autonomous Mobile Manipulation under Uncertainty (Page 2084)
Michael W. Lanighan (University of Massachusetts, Amherst)
Roderic A. Grupen (University of Massachusetts, Amherst)

Preference Learning in Automated Negotiation Using Gaussian Uncertainty Models (Page 2087)
Haralambie Leahu (Centrum Wiskunde & Informatica (CWI) IAS)
Michael Kaisers (Centrum Wiskunde & Informatica (CWI) IAS)
Tim Baarslag (Centrum Wiskunde & Informatica (CWI) IAS)

(Return to Top)

Meta-learning of Bidding Agent with Knowledge Gradient in a Fully Agent-based Sponsored Search Auction Simulator (Page 2090)
Donghun Lee (Princeton University)
Warren B. Powell (Princeton University)

Selective Information Disclosure in Contests (Page 2093)
Priel Levy (Bar Ilan University)
David Sarne (Bar-Ilan University)
Yonatan Aumann (Bar-Ilan University)

Learn a Robust Policy in Adversarial Games via Playing with an Expert Opponent (Page 2096)
Jialian Li (Tsinghua University)
Tongzheng Ren (Tsinghua University)
Hang Su (Tsinghua University)
Jun Zhu (Tsinghua University)

Social Mobilization to Reposition Indiscriminately Parked Shareable Bikes (Page 2099)
Zelei Liu (Jilin University)
Han Yu (Nanyang Technological University)
Leye Wang (Hong Kong University of Science and Technology)
Liang Hu (Jilin University)
Qiang Yang (Hong Kong University of Science and Technology)

Exploiting Inaccurate A Priori Knowledge in Robot Exploration (Page 2102)
Matteo Luperto (Università degli Studi di Milano)
Danilo Fusi (Politecnico di Milano)
N. Alberto Borghese (Università degli Studi di Milano)
Francesco Amigoni (Politecnico di Milano)

Polynomial-Time Multi-Agent Pathfinding with Heterogeneous and Self-Interested Agents (Page 2105)
Manao Machida (NEC Corporation)

DeepFlow: Detecting Optimal User Experience From Physiological Data Using Deep Neural Networks: Extended Abstract (Page 2108)
Marco Maier (TAWNY)
Chadly Marouane (TAWNY)
Daniel Elsner (TAWNY)

Thompson Sampling Based Multi-Armed-Bandit Mechanism Using Neural Networks (Page 2111)
Padala Manisha (International Institute of Information Technology)
Sujit Gujar (International Institute of Information Technology)

ViTALiSE: Virtual to Augmented Loop in Smart Environments (Page 2114)
Stefano Mariani (Università di Modena e Reggio Emilia)
Angelo Croatti (Università di Bologna)
Alessandro Ricci (Università di Bologna)
Andrea Prati (Università degli Studi di Parma)
Giuseppe Vizzari (Università di Milano-Bicocca)

Exploration in the Face of Parametric and Intrinsic Uncertainties (Page 2117)
Borislav Mavrin (Huawei Noah's Ark Lab & University of Alberta)
Shangtong Zhang (University of Oxford)
Hengshuai Yao (Huawei Noah's Ark Lab)
Linglong Kong (University of Alberta)

Strategyproof Facility Location for Three Agents on a Circle (Page 2120)
Reshef Meir (Technion -- Israel Institute if Technology)

Escape Room: A Configurable Testbed for Hierarchical Reinforcement Learning (Page 2123)
Jacob Menashe (The University of Texas at Austin)
Peter Stone (The University of Texas at Austin)

Object Exchangability in Reinforcement Learning (Page 2126)
John Mern (Stanford University)
Dorsa Sadigh (Stanford University)
Mykel Kochenderfer (Stanford University)

Coordination Structures Generated by Deep Reinforcement Learning in Distributed Task Executions (Page 2129)
Yuki Miyashita (Waseda University)
Toshiharu Sugawara (Waseda University)

Effects of Task Similarity on Policy Transfer with Selective Exploration in Reinforcement Learning (Page 2132)
Akshay Narayan (National University of Singapore)
Tze Yun Leong (National University of Singapore)

Can a Virtual Human Facilitate Language Learning in a Young Baby? (Page 2135)
Setareh Nasihati Gilani (University of Southern California)
David Traum (University of Southern California)
Rachel Sortino (Gallaudet University)
Grady Gallagher (Gallaudet University)
Kailyn Aaron-lozano (Gallaudet University)
Cryss Padilla (Gallaudet University)
Ari Shapiro (University of Southern California)
Jason Lamberton (Gallaudet University)
Laura-ann Petitto (Gallaudet University)

Designing Emergent Swarm Behaviors using Behavior Trees and Grammatical Evolution (Page 2138)
Aadesh Neupane (Brigham Young University)
Michael A. Goodrich (Brigham Young University)

(Return to Top)

Probabilistic Resource-bounded Alternating-time Temporal Logic (Page 2141)
Hoang Nga Nguyen (Coventry University)
Abdur Rakib (University of the West of England)

Strategic Majoritarian Voting with Propositional Goals (Page 2144)
Arianna Novaro (IRIT, University of Toulouse)
Umberto Grandi (University of Toulouse IRIT)
Dominique Longin (CNRS, Universite Paul Sabatier Toulouse III Institut de Recherche en Informatique de Toulouse (IRIT))
Emiliano Lorini (IRIT-CNRS)

Integrating Personality and Mood with Agent Emotions (Page 2147)
Suman Ojha (University of Technology Sydney)
Jonathan Vitale (University of Technology Sydney)
Syed Ali Raza (University of Technology Sydney)
Richard Billingsley (University of Technology Sydney)
Mary-Anne Williams (University of Technology Sydney)

Cooperative Routing with Heterogeneous Vehicles (Page 2150)
Keisuke Otaki (Toyota Central R&D Labs., Inc.)
Satoshi Koide (Toyota Central R&D Labs., Inc.)
Ayano Okoso (Toyota Central R&D Labs., Inc.)
Tomoki Nishi (Toyota Central R&D Labs., Inc.)

Computing Stable Solutions in Threshold Network Flow Games With Bounded Treewidth (Page 2153)
Aldo Pacchiano (University of California, Berkeley)
Yoram Bachrach (Deepmind)

Multiagent Learning and Coordination with Clustered Deep Q-Network (Page 2156)
Simon Pageaud (Université de Lyon - Université Claude Bernard Lyon 1 LIRIS CNRS UMR 5205 & NAVER LABS Europe)
Véronique Deslandres (Université de Lyon - Université Claude Bernard Lyon 1 LIRIS CNRS UMR 5205)
Vassilissa Lehoux (NAVER LABS Europe)
Salima Hassas (Université de Lyon - Université Claude Bernard Lyon 1 LIRIS CNRS UMR 5205)

Optimal Risk in Multiagent Blind Tournaments (Page 2159)
Theodore J. Perkins (Ottawa Hospital Research Institute & University of Ottawa)

Distributed Policy Iteration for Scalable Approximation of Cooperative Multi-Agent Policies (Page 2162)
Thomy Phan (Ludwig-Maximilians-University)
Kyrill Schmid (Ludwig-Maximilians-University)
Lenz Belzner (MaibornWolff)
Thomas Gabor (Ludwig-Maximilians-University)
Sebastian Feld (Ludwig-Maximilians-University)
Claudia Linnhoff-Popien (Ludwig-Maximilians-University)

A Polynomial-time Fragment of Epistemic Probabilistic Argumentation (Page 2165)
Nico Potyka (University of Osnabrueck)

Robust Peer-Monitoring on Graphs with an Application to Suicide Prevention in Social Networks (Page 2168)
Aida Rahmattalabi (University of Southern California)
Phebe Vayanos (University of Southern California)
Anthony Fulginiti (University of Denver)
Milind Tambe (University of Southern California)

Risk Averse Reinforcement Learning for Mixed Multi-agent Environments (Page 2171)
D. Sai Koti Reddy (IBM Research)
Amrita Saha (IBM Research)
Srikanth G. Tamilselvam (IBM Research)
Priyanka Agrawal (IBM Research)
Pankaj Dayama (IBM Research)

Curriculum Learning for Tightly Coupled Multiagent Systems (Page 2174)
Golden Rockefeller (Oregon State University)
Patrick Mannion (Galway-Mayo Institute of Technology)
Kagan Tumer (Oregon State University)

Installing Resilience in Distributed Constraint Optimization Operated by Physical Multi-Agent Systems (Page 2177)
Pierre Rust (Orange Labs Research)
Gauthier Picard (MINES Saint-Etienne Laboratoire Hubert Curien UMR CNRS 5516)
Fano Ramparany (Orange Labs Research)

Priority driven Local Optimization for Crowd Simulation (Page 2180)
Himangshu Saikia (KTH Royal Institute of Technology in Stockholm)
Fangkai Yang (KTH Royal Institute of Technology)
Christopher Peters (KTH Royal Institute of Technology)

Entailment Functions and Reasoning Under Inconsistency (Page 2183)
Yakoub Salhi (CRIL, U. Artois & CNRS)

(Return to Top)

The StarCraft Multi-Agent Challenge (Page 2186)
Mikayel Samvelyan (Russian-Armenian University)
Tabish Rashid (University of Oxford)
Christian Schroeder de Witt (University of Oxford)
Gregory Farquhar (University of Oxford)
Nantas Nardelli (University of Oxford)
Tim G. J. Rudner (University of Oxford)
Chia-Man Hung (University of Oxford)
Philip H. S. Torr (University of Oxford)
Jakob Foerster (University of Oxford)
Shimon Whiteson (University of Oxford)

Emergence of Scenario-Appropriate Collaborative Behaviors for Teams of Robotic Bodyguards (Page 2189)
Hassam Ullah Sheikh (University of Central Florida)
Ladislau Bölöni (University of Central Florida)

Evaluation of Optimization for Pedestrian Route Guidance in Real-world Crowded Scene (Page 2192)
Shusuke Shigenaka (Artificial Intelligence Research Center AIST)
Shunki Takami (University of Tsukuba)
Yoshihiko Ozaki (Artificial Intelligence Research Center AIST & GREE, Inc.)
Masaki Onishi (Artificial Intelligence Research Center AIST)
Tomohisa Yamashita (Hokkaido University)
Itsuki Noda (Artificial Intelligence Research Center AIST)

Towards Modeling the Interplay of Personality, Motivation, Emotion, and Mood in Social Agents (Page 2195)
Maayan Shvo (University of Toronto)
Jakob Buhmann (Disney Research)
Mubbasir Kapadia (Rutgers University)

An Open MAS Services Architecture for the V2G/G2V Problem (Page 2198)
Nikolaos Spanoudakis (Technical University of Crete)
Charilaos Akasiadis (Technical University of Crete)
Georgios Kechagias (Technical University of Crete)
Georgios Chalkiadakis (Technical University of Crete)

A Regulation Enforcement Solution for Multi-agent Reinforcement Learning (Page 2201)
Fan-Yun Sun (National Taiwan University)
Yen-Yu Chang (National Taiwan University)
Yueh-Hua Wu (National Taiwan University)
Shou-De Lin (National Taiwan University)

Generating an Agent Taxonomy Using Topological Data Analysis (Page 2204)
Samarth Swarup (University of Virginia)
Reza Rezazadegan (University of Virginia)

Two-stage N-person Prisoner's Dilemma with Social Preferences (Page 2206)
Seji Takanashi (Kyushu University)
Makoto Yokoo (Kyushu University)

An Optimal Rewiring Strategy for Cooperative Multiagent Social Learning (Page 2209)
Hongyao Tang (Tianjin University)
Jianye Hao (Tianjin University)
Li Wang (Tianjin University)
Zan Wang (Tianjin University)
Tim Baarslag (Centrum Wiskunde & Informatica)

Rethinking the Neutrality Axiom in Judgment Aggregation (Page 2212)
Zoi Terzopoulou (University of Amsterdam)
Ulle Endriss (University of Amsterdam)

General-Sum Cyber Deception Games under Partial Attacker Valuation Information (Page 2215)
Omkar Thakoor (University of Southern California)
Milind Tambe (University of Southern California)
Phebe Vayanos (University of Southern California)
Haifeng Xu (Harvard University)
Christopher Kiekintveld (The University of Texas at El Paso)

Towards a Prototypical Approach to Tool-Use Improvisation (Page 2218)
Madhura Thosar (Otto-von-Guericke University of Magdeburg)
Christian A. Mueller (Jacobs University)
Sebastian Zug (Technische Universitaet Bergakademie Freiberg)
Max Pfingsthorn (OFFIS Institute for Information Technology)

The Effect of First- and Third-person POVs on Different Cultural Communication: How Japanese People Understand Social Conversation at Thai Night Flea Markets (Page 2220)
Sutasinee Thovuttikul (Kyoto University & RIKEN Center for Advanced Intelligence Project)
Yoshimasa Ohmoto (Kyoto University)
Toyoaki Nishida (Kyoto University & RIKEN Center for Advanced Intelligence Project)

Deriving Norms from Actions, Values and Context (Page 2223)
Myrthe L. Tielman (Delft University of Technology)
Catholijn M. Jonker (Delft University of Technology)
M. Birna van Riemsdijk (Delft University of Technology)

MaMiC : Macro and Micro Curriculum for Robotic Reinforcement Learning (Page 2226)
Manan Tomar (Indian Institute of Technology Madras)
Akhil Sathuluri (Indian Institute of Technology Madras)
Balaraman Ravindran (Indian Institute of Technology Madras & Robert Bosch Center for Data Science and AI)

Adversarial Imitation Learning from State-only Demonstrations (Page 2229)
Faraz Torabi (The University of Texas at Austin)
Garrett Warnell (Army Research Laboratory)
Peter Stone (The University of Texas at Austin)

Explaining Failures Propagations in the Execution of Multi-Agent Temporal Plans (Page 2232)
Gianluca Torta (Università di Torino)
Roberto Micalizio (Università di Torino)
Samuele Sormano (Università di Torino)

DeepAggregation: A New Approach for Aggregating Incomplete Ranked Lists using Multi-Layer Graph Embedding (Page 2235)
Rohith Dwarakanath Vallam (IBM Research - India)
Ramasuri Narayanam (IBM Research - India)
Srikanth G. Tamilselvam (IBM Research - India)
Nicholas Mattei (Tulane University)
Sudhanshu S. Singh (IBM Research - India)
Shweta Garg (IBM Research - India)
Gyana R. Parija (IBM Research - India)

Contradict the Machine: A Hybrid Approach to Identifying Unknown Unknowns (Page 2238)
Colin Vandenhof (University of Waterloo)
Edith Law (University of Waterloo)

The Unbroken Telephone Game: Keeping Swarms Connected (Page 2241)
Vivek Shankar Varadharajan (École polytechnique de Montréal)
Bram Adams (École polytechnique de Montréal)
Giovanni Beltrame (École polytechnique de Montréal)

(Return to Top)

Online Motion Concept Learning: A Novel Algorithm for Sample-Efficient Learning and Recognition of Human Actions (Page 2244)
Miguel Vasco (INESC-ID, Instituto Superior Técnico, Universidade de Lisboa)
Francisco Melo (INESC-ID, Instituto Superior Técnico, Universidade de Lisboa)
David Martins de Matos (INESC-ID, Instituto Superior Técnico, Universidade de Lisboa)
Ana Paiva (INESC-ID, Instituto Superior Técnico, Universidade de Lisboa)
Tetsunari Inamura (National Institute of Informatics)

X*: Anytime Multiagent Planning With Bounded Search (Page 2247)
Kyle Vedder (University of Massachusetts, Amherst)
Joydeep Biswas (University of Massachusetts, Amherst)

A Reinforcement Learning Framework for Container Selection and Ship Load Sequencing in Ports (Page 2250)
Richa Verma (TCS Research)
Sarmimala Saikia (TCS Research)
Harshad Khadilkar (TCS Research)
Puneet Agarwal (TCS Research)
Gautam Shroff (TCS Research)
Ashwin Srinivasan (Birla Institute of Technology and Science)

A New Constraint Satisfaction Perspective on Multi-Agent Path Finding: Preliminary Results (Page 2253)
Jiangxing Wang (University of Southern California)
Jiaoyang Li (University of Southern California)
Hang Ma (University of Southern California)
Sven Koenig (University of Southern California)
T. K. Satish Kumar (University of Southern California)

Invincible Strategies of Iterated Prisoner's Dilemma (Page 2256)
Shiheng Wang (The Hong Kong University of Science and Technology (HKUST))
Fangzhen Lin (The Hong Kong University of Science and Technology (HKUST))

Efficient City-Scale Patrolling Using Decomposition and Grafting (Page 2259)
Wanyuan Wang (Southeast University)
Zichen Dong (Southeast University)
Bo An (Nanyang Technological University)
Yichuan Jiang (Southeast University)

Masquerade Attack Detection Through Observation Planning for Multi-Robot Systems (Page 2262)
Kacper Wardega (Boston University)
Roberto Tron (Boston University)
Wenchao Li (Boston University)

Multiagent Adversarial Inverse Reinforcement Learning (Page 2265)
Ermo Wei (George Mason University)
Drew Wicke (George Mason University)
Sean Luke (George Mason University)

Generating Voting Rules from Random Relations (Page 2267)
Nic Wilson (University College Cork)

Policy Networks: A Framework for Scalable Integration of Multiple Decision-Making Models (Page 2270)
Kyle Hollins Wray (University of Massachusetts, Amherst)
Shlomo Zilberstein (University of Massachusetts, Amherst)

A Privacy Preserving Multiagent System for Load Balancing in the Smart Grid (Page 2273)
Shangyu Xie (Illinois Institute of Technology)
Yuan Hong (Illinois Institute of Technology)
Peng-Jun Wan (Illinois Institute of Technology)

Learning Self-Game-Play Agents for Combinatorial Optimization Problems (Page 2276)
Ruiyang Xu (Northeastern University)
Karl Lieberherr (Northeastern University)

On the Maximization of Influence Over an Unknown Social Network (Page 2279)
Bo Yan (Beijing Institute of Technology)
Kexiu Song (Beijing Institute of Technology)
Jiamou Liu (The University of Auckland)
Fanku Meng (Beijing Institute of Technology)
Yiping Liu (Beijing Institute of Technology)
Hongyi Su (Beijing Institute of Technology)

Bayes-ToMoP: A Fast Detection and Best Response Algorithm Towards Sophisticated Opponents (Page 2282)
Tianpei Yang (Tianjin University)
Jianye Hao (Tianjin University)
Zhaopeng Meng (Tianjin University)
Yan Zheng (Tianjin University)
Chongjie Zhang (Tsinghua University)
Ze Zheng (Beifang Investigation,Design & Research CO.LTD)

Large-Scale Home Energy Management Using Entropy-Based Collective Multiagent Reinforcement Learning Framework (Page 2285)
Yaodong Yang (Tianjin University)
Jianye Hao (Tianjin University)
Yan Zheng (Tianjin University)
Xiaotian Hao (University of Tianjin)
Bofeng Fu (Tianjin University)

Modeling Random Guessing and Task Difficulty for Truth Inference in Crowdsourcing (Page 2288)
Yi Yang (Auckland University of Technilogy)
Quan Bai (University of Tasmania)
Qing Liu (CSIRO)

Complexity of Additive Committee Selection with Outliers (Page 2291)
Yongjie Yang (Central South University & Saarland University)
Jianxin Wang (Central South University)

Modeling Human Decision-Making during Hurricanes: From Model to Data Collection to Prediction (Page 2294)
Nutchanon Yongsatianchot (Northeastern University)
Stacy Marsella (Northeastern University)

Coordinated Multiagent Reinforcement Learning for Teams of Mobile Sensing Robots (Page 2297)
Chao Yu (Chao Yu)
Xin Wang (Dalian University of Technology)
Zhanbo Feng (Dalian University of Technology)

Ethically Aligned Multi-agent Coordination to Enhance Social Welfare (Page 2300)
Han Yu (Nanyang Technological University)
Zhiqi Shen (Nanyang Technological University)
Lizhen Cui (Shandong University)
Yongqing Zheng (Shandong University)
Victor R. Lesser (University of Massachusetts, Amherst)

Is Agent Software More Complex than Other Software? (Page 2303)
Alon Zanbar (Bar-Ilan University)
Gal A. Kaminka (Bar-Ilan University)

Report-Sensitive Spot-checking in Peer Grading (Page 2306)
Hedayat Zarkoob (University of British Columbia)
Hu Fu (University of British Columbia)
Kevin Leyton-Brown (University of British Columbia)

Multiagent Monte Carlo Tree Search (Page 2309)
Nicholas Zerbel (Oregon State University)
Logan Yliniemi (Amazon Robotics Research and Development)

Automatic Feature Engineering by Deep Reinforcement Learning (Page 2312)
Jianyu Zhang (Tianjin University)
Jianye Hao (Tianjin University)
Françoise Fogelman-Soulié (Tianjin University)
Zan Wang (Tianjin University)

Deep Generative and Discriminative Domain Adaptation (Page 2315)
Han Zhao (Carnegie Mellon University)
Junjie Hu (Carnegie Mellon University)
Zhenyao Zhu (Google)
Adam Coates (Apple)
Geoff Gordon (Carnegie Mellon University & Microsoft Research Montreal)

(Return to Top)

Stochastic Variance Reduction for Deep Q-learning (Page 2318)
Wei-ye Zhao (University of California, Berkeley)
Jian Peng (University of Illinois at Urbana-Champaign)

Learning Efficient Communication in Cooperative Multi-Agent Environment (Page 2321)
Yuhang Zhao (Peking University)
Xiujun Ma (Peking University)

A Q-values Sharing Framework for Multiple Independent Q-learners (Page 2324)
Changxi Zhu (South China University of Technology)
Ho-fung Leung (The Chinese University of Hong Kong)
Shuyue Hu (The Chinese University of Hong Kong)
Yi Cai (South China University of Technology)

Demonstrations

ConCon: A Contract Conflict Identifier (Page 2327)
João Paulo Aires (Pontifical Catholic University of Rio Grande do Sul)
Roger Granada (Pontifical Catholic University of Rio Grande do Sul)
Felipe Meneguzzi (Pontifical Catholic University of Rio Grande do Sul)

Implementing Business Processes in JaCaMo+ by Exploiting Accountability and Responsibility (Page 2330)
Matteo Baldoni (Università degli Studi di Torino)
Cristina Baroglio (Università desgli Studi di Torino)
Roberto Micalizio (Università desgli Studi di Torino)
Stefano Tedeschi (Università desgli Studi di Torino)

(Return to Top)

Multi-Agent Path Finding on Real Robots (Page 2333)
Roman Barták (Charles University)
Ivan Krasičenko (Charles University)
Jičí Švancara (Charles University)

Using Game Theory in Real Time in the Real World: A Conservation Case Study (Page 2336)
Elizabeth Bondi (University of Southern California)
Hoon Oh (Carnegie Mellon University)
Haifeng Xu (Harvard University)
Fei Fang (Carnegie Mellon University)
Bistra Dilkina (University of Southern California)
Milind Tambe (University of Southern California)

Learning an Effective Control Policy for a Robotic Drumstick via Self-Supervision (Page 2339)
Mason Bretan (Samsung Research America)
Siddharth Sanan (Samsung Research America)
Larry Heck (Samsung Research America)

eXplainable Modeling (XM): Data Analysis for Intelligent Agents (Page 2342)
Alberto Castellini (University of Verona)
Francesco Masillo (University of Verona)
Riccardo Sartea (University of Verona)
Alessandro Farinelli (University of Verona)

Computational Argumentation-based Clinical Decision Support (Page 2345)
Martin Chapman (King's College London)
Panagiotis Balatsoukas (King's College London)
Mark Ashworth (King's College London)
Vasa Curcin (King's College London)
Nadin Kökciyan (King's College London)
Kai Essers (King's College London)
Isabel Sassoon (King's College London)
Sanjay Modgil (King's College London)
Simon Parsons (King's College London)
Elizabeth I. Sklar (King's College London)

ONECG: Online Negotiation Environment for Coalitional Games (Page 2348)
Siqi Chen (Tianjin University)
Yonghao Cui (Tianjin University)
Cong Shang (Tianjin University)
Jianye Hao (Tianjin University)
Gerhard Weiss (Maastricht University)

For The Record - A Public Goods Game For Exploring Human-Robot Collaboration (Page 2351)
Filipa Correia (Universidade de Lisboa)
Samuel Mascarenhas (Universidade de Lisboa)
Samuel Gomes (Universidade de Lisboa)
Silvia Tulli (Universidade de Lisboa)
Fernando P. Santos (Princeton University & ATP-group)
Francisco C. Santos (Universidade de Lisboa & ATP-group)
Rui Prada (Universidade de Lisboa)
Francisco S. Melo (Universidade de Lisboa)
Ana Paiva (Universidade de Lisboa)

Traffic3D: A New Traffic Simulation Paradigm (Page 2354)
Deepeka Garg (Aston University)
Maria Chli (Aston University)
George Vogiatzis (Aston University)

An Accessible Toolkit for the Creation of Socio-EmotionalAgents (Page 2357)
Manuel Guimarães (INESC-ID & Instituto Superior Técnico, Universidade de Lisboa)
Samuel Mascarenhas (INESC-ID & Instituto Superior Técnico, Universidade de Lisboa)
Rui Prada (INESC-ID & Instituto Superior Técnico, Universidade de Lisboa)
Pedro A. Santos (INESC-ID & Instituto Superior Técnico, Universidade de Lisboa)
João Dias (INESC-ID & Instituto Superior Técnico, Universidade de Lisboa)

Peer-to-Peer Negotiation for Optimising Journeys of Electric Vehicles on a Tour of Europe (Page 2360)
Seyed Ali Hosseini (Fetch.ai)
Diarmid Campbell (Fetch.ai)
Marco Favorito (Fetch.ai)
Jonathan Ward (Fetch.ai)

PAPOW: Papow Aggregates Preferences and Orderings to select Winners (Page 2363)
Martin Jedwabny (IATE INRA & University of Buenos Aires)
Pierre Bisquert (IATE INRA, INRIA GraphIK)
Madalina Croitoru (INRIA GraphIK)

Deciding the Winner of a Debate Using Bipolar Argumentation (Page 2366)
Amin Karamlou (Imperial College London)
Kristijonas Čyras (Imperial College London)
Francesca Toni (Imperial College London)

RE-ORG: An Online Repositioning Guidance Agent (Page 2369)
Muralidhar Konda (Singapore Management University)
Pradeep Varakantham (Singapore Management University)
Aayush Saxena (Singapore Management University)
Meghna Lowalekar (Singapore Management University)

STV: Model Checking for Strategies under Imperfect Information (Page 2372)
Damian Kurpiewski (Polish Academy of Sciences)
Wojciech Jamroga (Polish Academy of Sciences)
Michał Knapik (Polish Academy of Sciences)

ALBidS: A Decision Support System for Strategic Bidding in Electricity Markets (Page 2375)
Tiago Pinto (Polytechnic of Porto)
Zita Vale (Polytechnic of Porto)

Practical Application of a Multi-Agent Systems Society for Energy Management and Control (Page 2378)
Tiago Pinto (Polytechnic of Porto)
Gabriel Santos (Polytechnic of Porto)
Zita Vale (Polytechnic of Porto)

Deploying a Shareholder Rights Management System onto a Distributed Ledger (Page 2381)
Luke Riley (King's College London)
Grammateia Kotsialou (King's College London)
Amrita Dhillon (King's College London)
Toktam Mahmoodi (King's College London)
Peter McBurney (King's College London)
Richard Pearce (Crowdcube)

Decision Support System for Opponents Selection in Electricity Markets Bilateral Negotiations (Page 2384)
Francisco Silva (Polytechnic of Porto)
Tiago Pinto (Polytechnic of Porto)
Zita Vale (Polytechnic of Porto)

Tangible Robotic Fleet Control (Page 2387)
David St-Onge (Polytechnique Montreal)
Vivek-Shankar Varadharajan (Polytechnique Montreal)
Giovanni Beltrame (Polytechnique Montreal)

NAKED: N-Ary Graphs from Knowledge Bases Expressed in Datalog± (Page 2390)
Bruno Yun (INRIA GraphIK, Université de Montpellier)
Madalina Croitoru (INRIA GraphIK, Université de Montpellier)
Srdjan Vesic (CRIL - CNRS, Université d’Artois)
Pierre Bisquert (IATE, INRA, INRIA GraphIK)

(Return to Top)

Doctoral Consortium

Intelligent Multi-Purpose Healthcare Bot Facilitating Shared Decision Making (Page 2393)
Mohammad Mehdi Afsar (University of Calgary)

Teaching Agents Through Correction (Page 2396)
Mattias Appelgren (University of Edinburgh)

Multi-Agent Coordination under Uncertain Communication (Page 2399)
Nikhil Bhargava (Massachusetts Institute of Technology)

Bridging the Gap Between High-Level Reasoning in Strategic Agent Coordination and Low-Level Agent Development (Page 2402)
Elizabeth Bondi (University of Southern California)

Improving Deep Reinforcement Learning via Transfer (Page 2405)
Yunshu Du (Washington State University)

Persuasive Social Robots using Social Power Dynamics (Page 2408)
Mojgan Hashemian (INESC-ID & Universidade de Lisboa)

Proactive Distributed Constraint Optimization Problems (Page 2411)
Khoi Hoang (Washington University in St. Louis)

Complexity of Distances in Elections (Page 2414)
Tobias Hogrebe (Heinrich-Heine-Universität Düsseldorf)

Sharing is Caring: Dynamic Mechanism for Shared Resource Ownership (Page 2417)
Ridi Hossain (National University of Singapore)

Using Social and Physiological Signals for User Adaptation in Conversational Agents (Page 2420)
Patrik Jonell (KTH Royal Institute of Technology)

Empathic Agents: A Hybrid Normative/Consequentialistic Approach (Page 2423)
Timotheus Kampik (Umeå University)

Adaptable Decentralized Task Allocation of Swarm Agents (Page 2426)
Vera A. Kazakova (University of Central Florida)

Mechanism Design with Unstructured Beliefs (Page 2429)
Bo Li (Stony Brook University)

Explainable Agency in Intelligent Agents (Page 2432)
Prashan Madumal (University of Melbourne)

Strategic Location and Network Formation Games (Page 2435)
Louise Molitor (Hasso Plattner Institute)

Conversational Narrative Interfaces for Sensemaking (Page 2438)
Andreea-Oana Petac (École Nationale d'Ingénieurs de Brest)

Novel Hedonic Games and Lottery Systems (Page 2441)
Jacob Schlueter (University of Kentucky)

Problems in Computational Mechanism Design (Page 2444)
Garima Shakya (Indian Institute of technology Kanpur)

Integrating Agent Advice and Previous Task Solutions in Multiagent Reinforcement Learning (Page 2447)
Felipe Leno Da Silva (University of Sao Paulo)

Aspects of Transparency in Machine Learning (Page 2449)
Martin Strobel (National University Singapore)

Studies on the Computational Modeling and Design of Financial Markets (Page 2452)
Xintong Wang (University of Michigan)

Enhanced Learning from Multiple Demonstrations with a Flexible Two-level Structure Approach (Page 2455)
Su Zhang (Washington State University)

Return to Top)