{"id":"https://openalex.org/W4414688349","doi":"https://doi.org/10.1145/3766882.3767176","title":"Challenges in Designing Robust RL-Based Autoscalers","display_name":"Challenges in Designing Robust RL-Based Autoscalers","publication_year":2025,"publication_date":"2025-10-01","ids":{"openalex":"https://openalex.org/W4414688349","doi":"https://doi.org/10.1145/3766882.3767176"},"language":"en","primary_location":{"id":"doi:10.1145/3766882.3767176","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3766882.3767176","pdf_url":null,"source":null,"license":"cc-by-nc-sa","license_id":"https://openalex.org/licenses/cc-by-nc-sa","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"gold","oa_url":"https://doi.org/10.1145/3766882.3767176","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5086848479","display_name":"Navidreza Asadi","orcid":"https://orcid.org/0000-0002-2155-1288"},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Navidreza Asadi","raw_affiliation_strings":["Technical University Munich, Munich, Germany"],"raw_orcid":"https://orcid.org/0000-0002-2155-1288","affiliations":[{"raw_affiliation_string":"Technical University Munich, Munich, Germany","institution_ids":[]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5119790819","display_name":"Dalal Ali","orcid":null},"institutions":[{"id":"https://openalex.org/I62916508","display_name":"Technical University of Munich","ror":"https://ror.org/02kkvpp62","country_code":"DE","type":"education","lineage":["https://openalex.org/I62916508"]}],"countries":["DE"],"is_corresponding":false,"raw_author_name":"Dalal Ali","raw_affiliation_strings":["Technical University of Munich, Munich, Germany"],"raw_orcid":"https://orcid.org/0009-0007-7159-4140","affiliations":[{"raw_affiliation_string":"Technical University of Munich, Munich, Germany","institution_ids":["https://openalex.org/I62916508"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5007385737","display_name":"R\u0103zvan-Mihai Ursu","orcid":"https://orcid.org/0009-0000-8495-4159"},"institutions":[{"id":"https://openalex.org/I62916508","display_name":"Technical University of Munich","ror":"https://ror.org/02kkvpp62","country_code":"DE","type":"education","lineage":["https://openalex.org/I62916508"]}],"countries":["DE"],"is_corresponding":false,"raw_author_name":"Razvan-Mihai Ursu","raw_affiliation_strings":["Technical University of Munich, Munich, Germany"],"raw_orcid":"https://orcid.org/0009-0000-8495-4159","affiliations":[{"raw_affiliation_string":"Technical University of Munich, Munich, Germany","institution_ids":["https://openalex.org/I62916508"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5021781616","display_name":"Wolfgang Kellerer","orcid":"https://orcid.org/0000-0003-4358-8038"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Wolfgang Kellerer","raw_affiliation_strings":["Technical University Munich, Munich, Germany"],"raw_orcid":"https://orcid.org/0000-0003-4358-8038","affiliations":[{"raw_affiliation_string":"Technical University Munich, Munich, Germany","institution_ids":[]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":["https://openalex.org/A5086848479"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.28113111,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"44","last_page":"49"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10054","display_name":"Parallel Computing and Optimization Techniques","score":0.9970999956130981,"subfield":{"id":"https://openalex.org/subfields/1708","display_name":"Hardware and Architecture"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10054","display_name":"Parallel Computing and Optimization Techniques","score":0.9970999956130981,"subfield":{"id":"https://openalex.org/subfields/1708","display_name":"Hardware and Architecture"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10904","display_name":"Embedded Systems Design Techniques","score":0.9922000169754028,"subfield":{"id":"https://openalex.org/subfields/1708","display_name":"Hardware and Architecture"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11522","display_name":"VLSI and FPGA Design Techniques","score":0.9919000267982483,"subfield":{"id":"https://openalex.org/subfields/2208","display_name":"Electrical and Electronic Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/observability","display_name":"Observability","score":0.7932999730110168},{"id":"https://openalex.org/keywords/metric","display_name":"Metric (unit)","score":0.5238999724388123},{"id":"https://openalex.org/keywords/generalization","display_name":"Generalization","score":0.4982999861240387},{"id":"https://openalex.org/keywords/orchestration","display_name":"Orchestration","score":0.49559998512268066},{"id":"https://openalex.org/keywords/unobservable","display_name":"Unobservable","score":0.4805000126361847},{"id":"https://openalex.org/keywords/workload","display_name":"Workload","score":0.44859999418258667},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.4424000084400177},{"id":"https://openalex.org/keywords/frame","display_name":"Frame (networking)","score":0.4009000062942505},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.39879998564720154}],"concepts":[{"id":"https://openalex.org/C36299963","wikidata":"https://www.wikidata.org/wiki/Q1369844","display_name":"Observability","level":2,"score":0.7932999730110168},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6194000244140625},{"id":"https://openalex.org/C176217482","wikidata":"https://www.wikidata.org/wiki/Q860554","display_name":"Metric (unit)","level":2,"score":0.5238999724388123},{"id":"https://openalex.org/C177148314","wikidata":"https://www.wikidata.org/wiki/Q170084","display_name":"Generalization","level":2,"score":0.4982999861240387},{"id":"https://openalex.org/C199168358","wikidata":"https://www.wikidata.org/wiki/Q3367000","display_name":"Orchestration","level":3,"score":0.49559998512268066},{"id":"https://openalex.org/C2780695315","wikidata":"https://www.wikidata.org/wiki/Q3799040","display_name":"Unobservable","level":2,"score":0.4805000126361847},{"id":"https://openalex.org/C2778476105","wikidata":"https://www.wikidata.org/wiki/Q628539","display_name":"Workload","level":2,"score":0.44859999418258667},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.4424000084400177},{"id":"https://openalex.org/C126042441","wikidata":"https://www.wikidata.org/wiki/Q1324888","display_name":"Frame (networking)","level":2,"score":0.4009000062942505},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.39879998564720154},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.3506999909877777},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.335999995470047},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.33390000462532043},{"id":"https://openalex.org/C2780378061","wikidata":"https://www.wikidata.org/wiki/Q25351891","display_name":"Service (business)","level":2,"score":0.33059999346733093},{"id":"https://openalex.org/C33676613","wikidata":"https://www.wikidata.org/wiki/Q13415176","display_name":"Dimension (graph theory)","level":2,"score":0.3280999958515167},{"id":"https://openalex.org/C63479239","wikidata":"https://www.wikidata.org/wiki/Q7353546","display_name":"Robustness (evolution)","level":3,"score":0.3255000114440918},{"id":"https://openalex.org/C2780598303","wikidata":"https://www.wikidata.org/wiki/Q65921492","display_name":"Flexibility (engineering)","level":2,"score":0.3003000020980835},{"id":"https://openalex.org/C127413603","wikidata":"https://www.wikidata.org/wiki/Q11023","display_name":"Engineering","level":0,"score":0.2867000102996826},{"id":"https://openalex.org/C165064840","wikidata":"https://www.wikidata.org/wiki/Q1321061","display_name":"Matching (statistics)","level":2,"score":0.2863999903202057},{"id":"https://openalex.org/C2779010991","wikidata":"https://www.wikidata.org/wiki/Q2720909","display_name":"Artifact (error)","level":2,"score":0.28290000557899475},{"id":"https://openalex.org/C2780129190","wikidata":"https://www.wikidata.org/wiki/Q5071912","display_name":"Changeover","level":3,"score":0.2732999920845032},{"id":"https://openalex.org/C31531917","wikidata":"https://www.wikidata.org/wiki/Q915157","display_name":"Robust control","level":3,"score":0.265500009059906},{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.2615000009536743},{"id":"https://openalex.org/C112930515","wikidata":"https://www.wikidata.org/wiki/Q4389547","display_name":"Risk analysis (engineering)","level":1,"score":0.2590000033378601},{"id":"https://openalex.org/C17098449","wikidata":"https://www.wikidata.org/wiki/Q176814","display_name":"Partially observable Markov decision process","level":4,"score":0.2565000057220459},{"id":"https://openalex.org/C2780898871","wikidata":"https://www.wikidata.org/wiki/Q860554","display_name":"Performance metric","level":2,"score":0.2549999952316284},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.2531000077724457}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1145/3766882.3767176","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3766882.3767176","pdf_url":null,"source":null,"license":"cc-by-nc-sa","license_id":"https://openalex.org/licenses/cc-by-nc-sa","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems","raw_type":"proceedings-article"},{"id":"pmh:oai:mediatum.ub.tum.de:node/1838834","is_oa":true,"landing_page_url":"https://mediatum.ub.tum.de/1838834","pdf_url":null,"source":{"id":"https://openalex.org/S4377196330","display_name":"mediaTUM  (Technical University of Munich)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I62916508","host_organization_name":"Technical University of Munich","host_organization_lineage":["https://openalex.org/I62916508"],"host_organization_lineage_names":[],"type":"repository"},"license":"other-oa","license_id":"https://openalex.org/licenses/other-oa","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"ConferencePaper"}],"best_oa_location":{"id":"doi:10.1145/3766882.3767176","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3766882.3767176","pdf_url":null,"source":null,"license":"cc-by-nc-sa","license_id":"https://openalex.org/licenses/cc-by-nc-sa","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems","raw_type":"proceedings-article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":9,"referenced_works":["https://openalex.org/W2011418219","https://openalex.org/W2037948924","https://openalex.org/W2751343396","https://openalex.org/W4221068643","https://openalex.org/W4308426647","https://openalex.org/W4394744886","https://openalex.org/W4413358490","https://openalex.org/W4414109577","https://openalex.org/W6950310954"],"related_works":[],"abstract_inverted_index":{"Reinforcement":[0],"learning":[1],"(RL)":[2],"offers":[3],"a":[4,101,114],"promising,":[5],"adaptive":[6],"alternative":[7],"to":[8,85],"heuristic-based":[9],"autoscaling,":[10],"yet":[11],"its":[12],"practical":[13],"adoption":[14],"in":[15,132],"production":[16],"environments":[17],"remains":[18],"negligible.":[19],"In":[20],"this":[21,26],"paper,":[22],"we":[23],"argue":[24],"that":[25,38,54,94,109,124],"gap":[27],"between":[28],"promise":[29],"and":[30,48,57,77,88,129],"practice":[31],"is":[32],"caused":[33],"by":[34],"three":[35],"systemic":[36],"challenges":[37,96],"violate":[39],"fundamental":[40],"RL":[41],"assumptions:":[42],"(i)":[43],"generalization":[44],"failures":[45],"under":[46],"workload":[47],"system":[49],"drift;":[50],"(ii)":[51],"orchestration":[52],"interference":[53],"obscures":[55],"causality;":[56],"(iii)":[58],"unreliable,":[59],"delayed":[60],"metric":[61],"feedback.":[62],"We":[63,107],"substantiate":[64],"these":[65,82,95],"claims":[66],"through":[67],"an":[68],"empirical":[69],"study":[70],"of":[71],"two":[72],"PPO-based":[73],"autoscalers":[74],"on":[75],"real-world":[76],"synthetic":[78],"workloads,":[79],"demonstrating":[80],"how":[81],"factors":[83],"lead":[84],"policy":[86],"instability":[87],"performance":[89],"degradation.":[90],"Our":[91],"findings":[92],"reveal":[93],"collectively":[97],"frame":[98],"autoscaling":[99,112],"as":[100],"Partially":[102],"Observable":[103],"Markov":[104],"Decision":[105],"Process.":[106],"conclude":[108],"robust":[110],"RL-based":[111],"requires":[113],"paradigm":[115],"shift":[116],"from":[117],"purely":[118],"algorithmic":[119],"solutions":[120],"toward":[121],"systems-aware":[122],"designs":[123],"model":[125],"the":[126],"partial":[127],"observability":[128],"non-stationarity":[130],"inherent":[131],"service":[133],"autoscaling.":[134]},"counts_by_year":[],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}