{"id":"https://openalex.org/W4297882632","doi":"https://doi.org/10.1145/3492866.3549714","title":"Online learning for multi-agent based resource allocation in weakly coupled wireless systems","display_name":"Online learning for multi-agent based resource allocation in weakly coupled wireless systems","publication_year":2022,"publication_date":"2022-09-21","ids":{"openalex":"https://openalex.org/W4297882632","doi":"https://doi.org/10.1145/3492866.3549714"},"language":"en","primary_location":{"id":"doi:10.1145/3492866.3549714","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3492866.3549714","pdf_url":"https://dl.acm.org/doi/pdf/10.1145/3492866.3549714","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the Twenty-Third International Symposium on Theory, Algorithmic Foundations, and Protocol Design for Mobile Networks and Mobile Computing","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"gold","oa_url":"https://dl.acm.org/doi/pdf/10.1145/3492866.3549714","any_repository_has_fulltext":null},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5015055879","display_name":"Jianhan Song","orcid":"https://orcid.org/0000-0001-5241-9426"},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Jianhan Song","raw_affiliation_strings":["The University of Texas at Austin"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"The University of Texas at Austin","institution_ids":["https://openalex.org/I86519309"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5008917819","display_name":"Gustavo de Veciana","orcid":"https://orcid.org/0000-0002-1498-494X"},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Gustavo de Veciana","raw_affiliation_strings":["The University of Texas at Austin"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"The University of Texas at Austin","institution_ids":["https://openalex.org/I86519309"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5028903768","display_name":"Sanjay Shakkottai","orcid":"https://orcid.org/0000-0002-4325-9050"},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Sanjay Shakkottai","raw_affiliation_strings":["The University of Texas at Austin"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"The University of Texas at Austin","institution_ids":["https://openalex.org/I86519309"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":3,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.169,"has_fulltext":true,"cited_by_count":1,"citation_normalized_percentile":{"value":0.54617651,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":90,"max":94},"biblio":{"volume":null,"issue":null,"first_page":"111","last_page":"120"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12101","display_name":"Advanced Bandit Algorithms Research","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T12101","display_name":"Advanced Bandit Algorithms Research","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10579","display_name":"Cognitive Radio Networks and Spectrum Sensing","score":0.9977999925613403,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10603","display_name":"Smart Grid Energy Management","score":0.9922000169754028,"subfield":{"id":"https://openalex.org/subfields/2208","display_name":"Electrical and Electronic Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7872606515884399},{"id":"https://openalex.org/keywords/wireless","display_name":"Wireless","score":0.6102019548416138},{"id":"https://openalex.org/keywords/base-station","display_name":"Base station","score":0.5962384939193726},{"id":"https://openalex.org/keywords/resource-allocation","display_name":"Resource allocation","score":0.5481727719306946},{"id":"https://openalex.org/keywords/distributed-computing","display_name":"Distributed computing","score":0.5282836556434631},{"id":"https://openalex.org/keywords/regret","display_name":"Regret","score":0.5088684558868408},{"id":"https://openalex.org/keywords/wireless-network","display_name":"Wireless network","score":0.45674437284469604},{"id":"https://openalex.org/keywords/resource-management","display_name":"Resource management (computing)","score":0.4532528817653656},{"id":"https://openalex.org/keywords/thompson-sampling","display_name":"Thompson sampling","score":0.44961825013160706},{"id":"https://openalex.org/keywords/power-control","display_name":"Power control","score":0.4243735671043396},{"id":"https://openalex.org/keywords/computer-network","display_name":"Computer network","score":0.4020931124687195},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.1805969476699829},{"id":"https://openalex.org/keywords/power","display_name":"Power (physics)","score":0.14621087908744812},{"id":"https://openalex.org/keywords/telecommunications","display_name":"Telecommunications","score":0.1149701476097107}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7872606515884399},{"id":"https://openalex.org/C555944384","wikidata":"https://www.wikidata.org/wiki/Q249","display_name":"Wireless","level":2,"score":0.6102019548416138},{"id":"https://openalex.org/C68649174","wikidata":"https://www.wikidata.org/wiki/Q1379116","display_name":"Base station","level":2,"score":0.5962384939193726},{"id":"https://openalex.org/C29202148","wikidata":"https://www.wikidata.org/wiki/Q287260","display_name":"Resource allocation","level":2,"score":0.5481727719306946},{"id":"https://openalex.org/C120314980","wikidata":"https://www.wikidata.org/wiki/Q180634","display_name":"Distributed computing","level":1,"score":0.5282836556434631},{"id":"https://openalex.org/C50817715","wikidata":"https://www.wikidata.org/wiki/Q79895177","display_name":"Regret","level":2,"score":0.5088684558868408},{"id":"https://openalex.org/C108037233","wikidata":"https://www.wikidata.org/wiki/Q11375","display_name":"Wireless network","level":3,"score":0.45674437284469604},{"id":"https://openalex.org/C2780609101","wikidata":"https://www.wikidata.org/wiki/Q17156588","display_name":"Resource management (computing)","level":2,"score":0.4532528817653656},{"id":"https://openalex.org/C73602740","wikidata":"https://www.wikidata.org/wiki/Q7795822","display_name":"Thompson sampling","level":3,"score":0.44961825013160706},{"id":"https://openalex.org/C56685638","wikidata":"https://www.wikidata.org/wiki/Q2300474","display_name":"Power control","level":3,"score":0.4243735671043396},{"id":"https://openalex.org/C31258907","wikidata":"https://www.wikidata.org/wiki/Q1301371","display_name":"Computer network","level":1,"score":0.4020931124687195},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.1805969476699829},{"id":"https://openalex.org/C163258240","wikidata":"https://www.wikidata.org/wiki/Q25342","display_name":"Power (physics)","level":2,"score":0.14621087908744812},{"id":"https://openalex.org/C76155785","wikidata":"https://www.wikidata.org/wiki/Q418","display_name":"Telecommunications","level":1,"score":0.1149701476097107},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1145/3492866.3549714","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3492866.3549714","pdf_url":"https://dl.acm.org/doi/pdf/10.1145/3492866.3549714","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the Twenty-Third International Symposium on Theory, Algorithmic Foundations, and Protocol Design for Mobile Networks and Mobile Computing","raw_type":"proceedings-article"}],"best_oa_location":{"id":"doi:10.1145/3492866.3549714","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3492866.3549714","pdf_url":"https://dl.acm.org/doi/pdf/10.1145/3492866.3549714","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the Twenty-Third International Symposium on Theory, Algorithmic Foundations, and Protocol Design for Mobile Networks and Mobile Computing","raw_type":"proceedings-article"},"sustainable_development_goals":[],"awards":[{"id":"https://openalex.org/G2195334859","display_name":"CNS Core: Small: Online Safe Reinforcement Learning for Wireless Resource Allocation","funder_award_id":"1910112","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G3556087353","display_name":"Collaborative Research: CNS Core: Medium: Analytics and Online Optimization at Scale for Cellular Networks","funder_award_id":"2107037","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G608057831","display_name":null,"funder_award_id":"W911NF-19","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G6814310006","display_name":null,"funder_award_id":"CNS-1910112, CNS-2107037, IIS-2112471","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G8016435669","display_name":null,"funder_award_id":"IIS-2112471","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"}],"funders":[{"id":"https://openalex.org/F4320306076","display_name":"National Science Foundation","ror":"https://ror.org/021nxhr62"}],"has_content":{"grobid_xml":true,"pdf":true},"content_urls":{"pdf":"https://content.openalex.org/works/W4297882632.pdf","grobid_xml":"https://content.openalex.org/works/W4297882632.grobid-xml"},"referenced_works_count":20,"referenced_works":["https://openalex.org/W1560389620","https://openalex.org/W1882177676","https://openalex.org/W1972001002","https://openalex.org/W2042892246","https://openalex.org/W2044772040","https://openalex.org/W2123049991","https://openalex.org/W2283268383","https://openalex.org/W2809610228","https://openalex.org/W2884787508","https://openalex.org/W2888943793","https://openalex.org/W2912712349","https://openalex.org/W2963832131","https://openalex.org/W2963961639","https://openalex.org/W2972216047","https://openalex.org/W3013955400","https://openalex.org/W3097585655","https://openalex.org/W3104943459","https://openalex.org/W3124061381","https://openalex.org/W3203107492","https://openalex.org/W3205540442"],"related_works":["https://openalex.org/W3108185025","https://openalex.org/W1850547517","https://openalex.org/W2964125852","https://openalex.org/W3176022311","https://openalex.org/W3048056964","https://openalex.org/W4287690869","https://openalex.org/W3046298489","https://openalex.org/W3015709540","https://openalex.org/W4287816990","https://openalex.org/W2923452570"],"abstract_inverted_index":{"We":[0,155],"propose":[1,82],"and":[2,44,152,186],"evaluate":[3],"a":[4,31,83,157,167,173],"learning-based":[5],"framework":[6,87],"to":[7,72,118,133,172],"address":[8],"multi-agent":[9],"resource":[10,34],"allocation":[11,35],"in":[12,144,188],"coupled":[13,54],"wireless":[14,146,190],"systems.":[15],"In":[16],"particular":[17],"we":[18,81,178],"consider,":[19],"multiple":[20],"agents":[21],"(e.g.,":[22],"base":[23],"stations,":[24],"access":[25],"points,":[26],"etc.)":[27],"that":[28,79],"choose":[29],"amongst":[30],"set":[32],"of":[33,113,124,183],"options":[36],"towards":[37],"achieving":[38],"their":[39],"own":[40],"performance":[41,47],"objective":[42],"/requirements,":[43],"where":[45],"the":[46,56,60,74,89,110,122,125,162,180],"observed":[48],"at":[49],"each":[50,114],"agent":[51,115],"is":[52,71,103,116,141],"further":[53],"with":[55,170],"actions":[57,91],"chosen":[58],"by":[59],"other":[61],"agents,":[62],"e.g.,":[63],"through":[64,97,176],"interference,":[65],"channel":[66,150],"leakage,":[67],"etc.":[68],"The":[69],"challenge":[70],"find":[73],"best":[75,90,111],"collective":[76],"action.":[77],"To":[78],"end":[80],"Multi-Armed":[84],"Bandit":[85],"(MAB)":[86],"wherein":[88,109],"(aka":[92],"arms)":[93],"are":[94,107],"adaptively":[95],"learned":[96],"online":[98],"reward":[99],"feedback.":[100],"Our":[101],"focus":[102],"on":[104,161],"systems":[105],"which":[106,165],"\"weakly-coupled\"":[108],"arm":[112,120],"invariant":[117],"others'":[119],"selection":[121,151],"majority":[123,129],"time":[126],"-":[127],"this":[128],"structure":[130,140],"enables":[131],"one":[132],"develop":[134,156],"light":[135],"weight":[136],"efficient":[137],"algorithms.":[138],"This":[139],"commonly":[142],"found":[143],"many":[145],"settings":[147],"such":[148],"as":[149],"power":[153],"control.":[154],"bandit":[158],"algorithm":[159,187],"based":[160],"Track-and-Stop":[163],"strategy,":[164],"shows":[166],"logarithmic":[168],"regret":[169],"respect":[171],"genie.":[174],"Finally":[175],"simulation,":[177],"exhibit":[179],"potential":[181],"use":[182],"our":[184],"model":[185],"several":[189],"application":[191],"scenarios.":[192]},"counts_by_year":[{"year":2023,"cited_by_count":1}],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}