{"id":"https://openalex.org/W7160987169","doi":"https://doi.org/10.48550/arxiv.2605.12388","title":"Events as Triggers for Behavioral Diversity in Multi-Agent Reinforcement Learning","display_name":"Events as Triggers for Behavioral Diversity in Multi-Agent Reinforcement Learning","publication_year":2026,"publication_date":"2026-05-12","ids":{"openalex":"https://openalex.org/W7160987169","doi":"https://doi.org/10.48550/arxiv.2605.12388"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2605.12388","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.12388","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2605.12388","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5136028940","display_name":"Hannes B\u00fcchi","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"B\u00fcchi, Hannes","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5060282741","display_name":"Manon Flageat","orcid":"https://orcid.org/0000-0002-4601-2176"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Flageat, Manon","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5136062418","display_name":"Eduardo Sebasti\u00e1n","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Sebasti\u00e1n, Eduardo","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5136045695","display_name":"Amanda Prorok","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Prorok, Amanda","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":4,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.911300003528595,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.911300003528595,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11307","display_name":"Domain Adaptation and Few-Shot Learning","score":0.016599999740719795,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12026","display_name":"Explainable Artificial Intelligence (XAI)","score":0.007400000002235174,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7405999898910522},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.5916000008583069},{"id":"https://openalex.org/keywords/control-reconfiguration","display_name":"Control reconfiguration","score":0.5411999821662903},{"id":"https://openalex.org/keywords/diversity","display_name":"Diversity (politics)","score":0.5317000150680542},{"id":"https://openalex.org/keywords/metric","display_name":"Metric (unit)","score":0.529699981212616},{"id":"https://openalex.org/keywords/maximization","display_name":"Maximization","score":0.5145000219345093},{"id":"https://openalex.org/keywords/adaptation","display_name":"Adaptation (eye)","score":0.4699999988079071},{"id":"https://openalex.org/keywords/state","display_name":"State (computer science)","score":0.4074000120162964}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7405999898910522},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6766999959945679},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.5916000008583069},{"id":"https://openalex.org/C119701452","wikidata":"https://www.wikidata.org/wiki/Q5165881","display_name":"Control reconfiguration","level":2,"score":0.5411999821662903},{"id":"https://openalex.org/C2781316041","wikidata":"https://www.wikidata.org/wiki/Q1230584","display_name":"Diversity (politics)","level":2,"score":0.5317000150680542},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5304999947547913},{"id":"https://openalex.org/C176217482","wikidata":"https://www.wikidata.org/wiki/Q860554","display_name":"Metric (unit)","level":2,"score":0.529699981212616},{"id":"https://openalex.org/C2776330181","wikidata":"https://www.wikidata.org/wiki/Q18358244","display_name":"Maximization","level":2,"score":0.5145000219345093},{"id":"https://openalex.org/C139807058","wikidata":"https://www.wikidata.org/wiki/Q352374","display_name":"Adaptation (eye)","level":2,"score":0.4699999988079071},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.4074000120162964},{"id":"https://openalex.org/C177264268","wikidata":"https://www.wikidata.org/wiki/Q1514741","display_name":"Set (abstract data type)","level":2,"score":0.3889000117778778},{"id":"https://openalex.org/C2778355321","wikidata":"https://www.wikidata.org/wiki/Q17079427","display_name":"Identity (music)","level":2,"score":0.38420000672340393},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.37049999833106995},{"id":"https://openalex.org/C67203356","wikidata":"https://www.wikidata.org/wiki/Q1321905","display_name":"Reinforcement","level":2,"score":0.3668999969959259},{"id":"https://openalex.org/C180747234","wikidata":"https://www.wikidata.org/wiki/Q23373","display_name":"Cognitive psychology","level":1,"score":0.3617999851703644},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.34630000591278076},{"id":"https://openalex.org/C41550386","wikidata":"https://www.wikidata.org/wiki/Q529909","display_name":"Multi-agent system","level":2,"score":0.33889999985694885},{"id":"https://openalex.org/C175154964","wikidata":"https://www.wikidata.org/wiki/Q380077","display_name":"Task analysis","level":3,"score":0.313400000333786},{"id":"https://openalex.org/C79416737","wikidata":"https://www.wikidata.org/wiki/Q2305519","display_name":"Social learning","level":2,"score":0.31029999256134033},{"id":"https://openalex.org/C15744967","wikidata":"https://www.wikidata.org/wiki/Q9418","display_name":"Psychology","level":0,"score":0.2831000089645386},{"id":"https://openalex.org/C118070581","wikidata":"https://www.wikidata.org/wiki/Q2060528","display_name":"Neuroevolution","level":3,"score":0.28139999508857727},{"id":"https://openalex.org/C136197465","wikidata":"https://www.wikidata.org/wiki/Q1729295","display_name":"Variety (cybernetics)","level":2,"score":0.2648000121116638},{"id":"https://openalex.org/C2778334786","wikidata":"https://www.wikidata.org/wiki/Q1586270","display_name":"Variation (astronomy)","level":2,"score":0.2606000006198883},{"id":"https://openalex.org/C529865628","wikidata":"https://www.wikidata.org/wiki/Q1790740","display_name":"Manifold (fluid mechanics)","level":2,"score":0.259799987077713},{"id":"https://openalex.org/C19768560","wikidata":"https://www.wikidata.org/wiki/Q320727","display_name":"Dependency (UML)","level":2,"score":0.2587999999523163},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.25}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2605.12388","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.12388","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2605.12388","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.12388","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Effective":[0],"multi-agent":[1],"cooperation":[2],"requires":[3],"agents":[4,53,115],"to":[5,13,42,55,69,121,131,179],"adopt":[6],"diverse":[7],"behaviors":[8,41,118,151],"as":[9],"task":[10],"conditions":[11],"evolve-and":[12],"do":[14],"so":[15],"at":[16,60],"the":[17,35,74,83,86,93,214],"right":[18],"moment.":[19],"Yet,":[20],"current":[21],"Multi-Agent":[22],"Reinforcement":[23],"Learning":[24],"(MARL)":[25],"frameworks":[26],"that":[27,37,88,103,147,162,183,187,200,217],"facilitate":[28],"this":[29,97,184],"diversity":[30,188],"are":[31,48,80,152],"still":[32],"limited":[33],"by":[34,195],"fact":[36],"they":[38,47],"bind":[39],"fixed":[40,43],"agent":[44,105],"identities.":[45],"Consequently,":[46],"ill-equipped":[49],"for":[50],"tasks":[51,219],"where":[52],"need":[54],"take":[56],"on":[57,96,127],"different":[58],"roles":[59],"very":[61],"specific":[62],"moments":[63],"in":[64,82,92,119,177],"time.":[65],"We":[66,181],"argue":[67],"that,":[68],"define":[70],"these":[71],"behavioral":[72],"transitions,":[73],"missing":[75],"ingredient":[76],"is":[77,125],"$\\textbf{events}$.":[78],"Events":[79],"changes":[81,91],"state":[84],"of":[85],"system":[87],"induce":[89],"qualitative":[90],"task.":[94],"Based":[95],"view,":[98],"we":[99,137,157],"introduce":[100,138],"a":[101,110,143,169],"framework":[102,124,202],"decouples":[104],"identity":[106],"from":[107,113],"behavior,":[108],"capturing":[109],"continuous":[111],"manifold":[112],"which":[114],"instantiate":[116],"their":[117],"response":[120,178],"events.":[122,180],"This":[123],"based":[126],"two":[128],"elements.":[129],"First,":[130],"build":[132],"an":[133,159],"expressive":[134],"behavior":[135,222],"manifold,":[136],"Neural":[139],"Manifold":[140],"Diversity":[141],"(NMD),":[142],"formal":[144],"distance":[145],"metric":[146],"remains":[148],"well-defined":[149],"when":[150],"transient":[153],"and":[154,212],"agent-agnostic.":[155],"Second,":[156],"use":[158],"event-based":[160],"hypernetwork":[161],"generates":[163],"Low-Rank":[164],"Adaptation":[165],"(LoRA)":[166],"modules":[167],"over":[168],"shared":[170],"team":[171],"policy,":[172],"enabling":[173],"on-the-fly":[174],"agent-policy":[175],"reconfiguration":[176],"prove":[182],"construction":[185],"ensures":[186],"does":[189],"not":[190],"interfere":[191],"with":[192],"reward":[193],"maximization":[194],"design.":[196],"Empirical":[197],"results":[198],"demonstrate":[199],"our":[201],"outperforms":[203],"established":[204],"baselines":[205],"across":[206],"benchmarks":[207],"while":[208],"exhibiting":[209],"zero-shot":[210],"generalization,":[211],"being":[213],"only":[215],"method":[216],"solves":[218],"requiring":[220],"sequential":[221],"reassignment.":[223]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-05-14T00:00:00"}