{"id":"https://openalex.org/W7162106990","doi":"https://doi.org/10.48550/arxiv.2605.21932","title":"Auction-Consensus Algorithm with Learned Bidding Scheme for Multi-Robot Systems","display_name":"Auction-Consensus Algorithm with Learned Bidding Scheme for Multi-Robot Systems","publication_year":2026,"publication_date":"2026-05-21","ids":{"openalex":"https://openalex.org/W7162106990","doi":"https://doi.org/10.48550/arxiv.2605.21932"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2605.21932","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.21932","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2605.21932","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5136758134","display_name":"Jose Rodriguez","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Rodriguez, Jose","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5136731508","display_name":"Constantine Tarawneh","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Tarawneh, Constantine","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5136788182","display_name":"Sven Koenig","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Koenig, Sven","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5136736925","display_name":"Wenjie Dong","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Dong, Wenjie","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5136810473","display_name":"Qi Lu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Lu, Qi","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":5,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.7538999915122986,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.7538999915122986,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10249","display_name":"Distributed Control Multi-Agent Systems","score":0.14810000360012054,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.040300000458955765,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/bidding","display_name":"Bidding","score":0.8690000176429749},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7052000164985657},{"id":"https://openalex.org/keywords/scalability","display_name":"Scalability","score":0.6812999844551086},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.5228999853134155},{"id":"https://openalex.org/keywords/common-value-auction","display_name":"Common value auction","score":0.48399999737739563},{"id":"https://openalex.org/keywords/decentralised-system","display_name":"Decentralised system","score":0.44020000100135803},{"id":"https://openalex.org/keywords/set","display_name":"Set (abstract data type)","score":0.4302000105381012},{"id":"https://openalex.org/keywords/scheme","display_name":"Scheme (mathematics)","score":0.41339999437332153}],"concepts":[{"id":"https://openalex.org/C9233905","wikidata":"https://www.wikidata.org/wiki/Q3276328","display_name":"Bidding","level":2,"score":0.8690000176429749},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7685999870300293},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7052000164985657},{"id":"https://openalex.org/C48044578","wikidata":"https://www.wikidata.org/wiki/Q727490","display_name":"Scalability","level":2,"score":0.6812999844551086},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.5228999853134155},{"id":"https://openalex.org/C163239763","wikidata":"https://www.wikidata.org/wiki/Q5153637","display_name":"Common value auction","level":2,"score":0.48399999737739563},{"id":"https://openalex.org/C120314980","wikidata":"https://www.wikidata.org/wiki/Q180634","display_name":"Distributed computing","level":1,"score":0.45339998602867126},{"id":"https://openalex.org/C205875254","wikidata":"https://www.wikidata.org/wiki/Q17156857","display_name":"Decentralised system","level":3,"score":0.44020000100135803},{"id":"https://openalex.org/C177264268","wikidata":"https://www.wikidata.org/wiki/Q1514741","display_name":"Set (abstract data type)","level":2,"score":0.4302000105381012},{"id":"https://openalex.org/C77618280","wikidata":"https://www.wikidata.org/wiki/Q1155772","display_name":"Scheme (mathematics)","level":2,"score":0.41339999437332153},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.4074999988079071},{"id":"https://openalex.org/C2778134712","wikidata":"https://www.wikidata.org/wiki/Q1047307","display_name":"Bundle","level":2,"score":0.37689998745918274},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.34869998693466187},{"id":"https://openalex.org/C51823790","wikidata":"https://www.wikidata.org/wiki/Q504353","display_name":"Greedy algorithm","level":2,"score":0.3400000035762787},{"id":"https://openalex.org/C181335050","wikidata":"https://www.wikidata.org/wiki/Q14915018","display_name":"Swarm behaviour","level":2,"score":0.2996000051498413},{"id":"https://openalex.org/C175154964","wikidata":"https://www.wikidata.org/wiki/Q380077","display_name":"Task analysis","level":3,"score":0.28139999508857727},{"id":"https://openalex.org/C169337768","wikidata":"https://www.wikidata.org/wiki/Q2446723","display_name":"Swarm robotics","level":3,"score":0.27129998803138733},{"id":"https://openalex.org/C66322947","wikidata":"https://www.wikidata.org/wiki/Q11658","display_name":"Transformer","level":3,"score":0.25769999623298645},{"id":"https://openalex.org/C137836250","wikidata":"https://www.wikidata.org/wiki/Q984063","display_name":"Optimization problem","level":2,"score":0.25529998540878296},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.25360000133514404}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2605.21932","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.21932","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2605.21932","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2605.21932","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Multi-Robot":[0],"Task":[1],"Allocation":[2],"(MRTA)":[3],"is":[4,73,117],"a":[5,63,76,85,143,196],"central":[6],"challenge":[7],"in":[8,67],"decentralized":[9,41,89,111,178,201],"multi-agent":[10],"systems,":[11],"where":[12],"teams":[13],"of":[14,186],"robots":[15],"must":[16],"cooperatively":[17],"assign":[18],"and":[19,88,107,153],"execute":[20],"tasks":[21],"under":[22],"limited":[23],"communication":[24],"while":[25,102,176],"optimizing":[26],"global":[27],"performance":[28],"objectives.":[29],"Auction-consensus":[30],"algorithms,":[31,194],"such":[32],"as":[33],"the":[34,104,147,154,184],"Consensus-Based":[35],"Bundle":[36],"Algorithm":[37],"(CBBA),":[38],"provide":[39],"scalable":[40,197],"coordination":[42,193],"with":[43,123,190],"provable":[44],"convergence,":[45],"but":[46],"rely":[47],"on":[48],"hand-crafted":[49],"greedy":[50],"scoring":[51],"functions":[52],"that":[53,165],"often":[54],"lead":[55],"to":[56,94,128],"suboptimal":[57],"task":[58,96,203],"allocations.":[59],"This":[60],"paper":[61],"proposes":[62],"learning-enhanced":[64],"auction-consensus":[65],"framework":[66],"which":[68],"CBBA's":[69],"deterministic":[70],"bidding":[71,78,115,167],"mechanism":[72],"replaced":[74],"by":[75,126],"neural":[77,138],"policy":[79,116],"trained":[80,118],"using":[81,119],"reinforcement":[82,188],"learning.":[83],"Under":[84],"centralized":[86],"training":[87],"execution":[90],"paradigm,":[91],"agents":[92],"learn":[93],"compute":[95],"bids":[97],"from":[98],"partial":[99],"local":[100],"observations":[101],"retaining":[103],"standard":[105],"auction":[106],"consensus":[108],"phases":[109],"for":[110],"coordination.":[112],"The":[113,180],"learned":[114,166],"Proximal":[120],"Policy":[121],"Optimization":[122],"rewards":[124],"shaped":[125],"proximity":[127],"globally":[129],"optimal":[130],"solutions":[131],"obtained":[132],"via":[133],"mixed-integer":[134],"linear":[135],"programming.":[136],"Multiple":[137],"architectures":[139],"are":[140],"evaluated,":[141],"including":[142],"Neural":[144],"Additive":[145],"Model,":[146],"Long":[148],"Short-Term":[149],"Memory":[150],"(LSTM)":[151],"model,":[152],"Set":[155],"Transformer":[156],"Model.":[157],"Experimental":[158],"results":[159],"across":[160],"varying":[161],"swarm":[162],"sizes":[163],"demonstrate":[164],"policies":[168],"can":[169],"improve":[170],"solution":[171],"quality":[172],"over":[173],"classical":[174,191],"CBBA":[175],"preserving":[177],"execution.":[179],"proposed":[181],"approach":[182],"highlights":[183],"effectiveness":[185],"integrating":[187],"learning":[189],"distributed":[192],"offering":[195],"pathway":[198],"toward":[199],"higher-quality":[200],"multi-robot":[202],"allocation.":[204]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-05-23T00:00:00"}