{"id":"https://openalex.org/W4315488712","doi":"https://doi.org/10.1109/cdc51059.2022.9993177","title":"Sparsity Inducing System Representations for Policy Decompositions","display_name":"Sparsity Inducing System Representations for Policy Decompositions","publication_year":2022,"publication_date":"2022-12-06","ids":{"openalex":"https://openalex.org/W4315488712","doi":"https://doi.org/10.1109/cdc51059.2022.9993177"},"language":"en","primary_location":{"id":"doi:10.1109/cdc51059.2022.9993177","is_oa":false,"landing_page_url":"http://dx.doi.org/10.1109/cdc51059.2022.9993177","pdf_url":null,"source":{"id":"https://openalex.org/S4363607710","display_name":"2022 IEEE 61st Conference on Decision and Control (CDC)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2022 IEEE 61st Conference on Decision and Control (CDC)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5032122141","display_name":"Ashwin Khadke","orcid":null},"institutions":[{"id":"https://openalex.org/I74973139","display_name":"Carnegie Mellon University","ror":"https://ror.org/05x2bcf33","country_code":"US","type":"education","lineage":["https://openalex.org/I74973139"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Ashwin Khadke","raw_affiliation_strings":["Carnegie Mellon University,Robotics Institute,Pittsburgh,PA,USA,15213"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Carnegie Mellon University,Robotics Institute,Pittsburgh,PA,USA,15213","institution_ids":["https://openalex.org/I74973139"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5078844630","display_name":"Hartmut Geyer","orcid":"https://orcid.org/0000-0003-3238-3299"},"institutions":[{"id":"https://openalex.org/I74973139","display_name":"Carnegie Mellon University","ror":"https://ror.org/05x2bcf33","country_code":"US","type":"education","lineage":["https://openalex.org/I74973139"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Hartmut Geyer","raw_affiliation_strings":["Carnegie Mellon University,Robotics Institute,Pittsburgh,PA,USA,15213"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Carnegie Mellon University,Robotics Institute,Pittsburgh,PA,USA,15213","institution_ids":["https://openalex.org/I74973139"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.1038,"has_fulltext":false,"cited_by_count":1,"citation_normalized_percentile":{"value":0.35001325,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":90,"max":94},"biblio":{"volume":"32","issue":null,"first_page":"6824","last_page":"6829"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9986000061035156,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9986000061035156,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11206","display_name":"Model Reduction and Neural Networks","score":0.9886999726295471,"subfield":{"id":"https://openalex.org/subfields/3109","display_name":"Statistical and Nonlinear Physics"},"field":{"id":"https://openalex.org/fields/31","display_name":"Physics and Astronomy"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10409","display_name":"Fuel Cells and Related Materials","score":0.9840999841690063,"subfield":{"id":"https://openalex.org/subfields/2208","display_name":"Electrical and Electronic Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.6623883843421936},{"id":"https://openalex.org/keywords/decomposition","display_name":"Decomposition","score":0.6277395486831665},{"id":"https://openalex.org/keywords/curse-of-dimensionality","display_name":"Curse of dimensionality","score":0.6150587201118469},{"id":"https://openalex.org/keywords/representation","display_name":"Representation (politics)","score":0.6007488965988159},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.5721158981323242},{"id":"https://openalex.org/keywords/heuristic","display_name":"Heuristic","score":0.5396474003791809},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.5256071090698242},{"id":"https://openalex.org/keywords/trajectory","display_name":"Trajectory","score":0.5188937783241272},{"id":"https://openalex.org/keywords/optimal-control","display_name":"Optimal control","score":0.49404576420783997},{"id":"https://openalex.org/keywords/state","display_name":"State (computer science)","score":0.48126620054244995},{"id":"https://openalex.org/keywords/dimensionality-reduction","display_name":"Dimensionality reduction","score":0.46458369493484497},{"id":"https://openalex.org/keywords/computation","display_name":"Computation","score":0.433525413274765},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.42990612983703613},{"id":"https://openalex.org/keywords/reduction","display_name":"Reduction (mathematics)","score":0.42683154344558716},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.3396047353744507},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.23358869552612305},{"id":"https://openalex.org/keywords/algorithm","display_name":"Algorithm","score":0.22658422589302063},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.17999911308288574}],"concepts":[{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.6623883843421936},{"id":"https://openalex.org/C124681953","wikidata":"https://www.wikidata.org/wiki/Q339062","display_name":"Decomposition","level":2,"score":0.6277395486831665},{"id":"https://openalex.org/C111030470","wikidata":"https://www.wikidata.org/wiki/Q1430460","display_name":"Curse of dimensionality","level":2,"score":0.6150587201118469},{"id":"https://openalex.org/C2776359362","wikidata":"https://www.wikidata.org/wiki/Q2145286","display_name":"Representation (politics)","level":3,"score":0.6007488965988159},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5721158981323242},{"id":"https://openalex.org/C173801870","wikidata":"https://www.wikidata.org/wiki/Q201413","display_name":"Heuristic","level":2,"score":0.5396474003791809},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.5256071090698242},{"id":"https://openalex.org/C13662910","wikidata":"https://www.wikidata.org/wiki/Q193139","display_name":"Trajectory","level":2,"score":0.5188937783241272},{"id":"https://openalex.org/C91575142","wikidata":"https://www.wikidata.org/wiki/Q1971426","display_name":"Optimal control","level":2,"score":0.49404576420783997},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.48126620054244995},{"id":"https://openalex.org/C70518039","wikidata":"https://www.wikidata.org/wiki/Q16000077","display_name":"Dimensionality reduction","level":2,"score":0.46458369493484497},{"id":"https://openalex.org/C45374587","wikidata":"https://www.wikidata.org/wiki/Q12525525","display_name":"Computation","level":2,"score":0.433525413274765},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.42990612983703613},{"id":"https://openalex.org/C111335779","wikidata":"https://www.wikidata.org/wiki/Q3454686","display_name":"Reduction (mathematics)","level":2,"score":0.42683154344558716},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.3396047353744507},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.23358869552612305},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.22658422589302063},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.17999911308288574},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.0},{"id":"https://openalex.org/C199539241","wikidata":"https://www.wikidata.org/wiki/Q7748","display_name":"Law","level":1,"score":0.0},{"id":"https://openalex.org/C17744445","wikidata":"https://www.wikidata.org/wiki/Q36442","display_name":"Political science","level":0,"score":0.0},{"id":"https://openalex.org/C1276947","wikidata":"https://www.wikidata.org/wiki/Q333","display_name":"Astronomy","level":1,"score":0.0},{"id":"https://openalex.org/C86803240","wikidata":"https://www.wikidata.org/wiki/Q420","display_name":"Biology","level":0,"score":0.0},{"id":"https://openalex.org/C94625758","wikidata":"https://www.wikidata.org/wiki/Q7163","display_name":"Politics","level":2,"score":0.0},{"id":"https://openalex.org/C2524010","wikidata":"https://www.wikidata.org/wiki/Q8087","display_name":"Geometry","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C18903297","wikidata":"https://www.wikidata.org/wiki/Q7150","display_name":"Ecology","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/cdc51059.2022.9993177","is_oa":false,"landing_page_url":"http://dx.doi.org/10.1109/cdc51059.2022.9993177","pdf_url":null,"source":{"id":"https://openalex.org/S4363607710","display_name":"2022 IEEE 61st Conference on Decision and Control (CDC)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2022 IEEE 61st Conference on Decision and Control (CDC)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":28,"referenced_works":["https://openalex.org/W1988376519","https://openalex.org/W1991927580","https://openalex.org/W2039401467","https://openalex.org/W2064733273","https://openalex.org/W2077166865","https://openalex.org/W2086953401","https://openalex.org/W2088872157","https://openalex.org/W2098432798","https://openalex.org/W2110729927","https://openalex.org/W2143564263","https://openalex.org/W2172945660","https://openalex.org/W2735197468","https://openalex.org/W2736601468","https://openalex.org/W2913238847","https://openalex.org/W2965680175","https://openalex.org/W3101360817","https://openalex.org/W3175768999","https://openalex.org/W3206205505","https://openalex.org/W4226213194","https://openalex.org/W4288320194","https://openalex.org/W6633534431","https://openalex.org/W6692846177","https://openalex.org/W6741002519","https://openalex.org/W6758814384","https://openalex.org/W6763088550","https://openalex.org/W6765242767","https://openalex.org/W6804601995","https://openalex.org/W6811434183"],"related_works":["https://openalex.org/W4400868993","https://openalex.org/W3096874164","https://openalex.org/W1985560493","https://openalex.org/W2937181779","https://openalex.org/W2386410636","https://openalex.org/W2357975469","https://openalex.org/W2145363145","https://openalex.org/W1626977535","https://openalex.org/W1995622179","https://openalex.org/W1484111231"],"abstract_inverted_index":{"Policy":[0],"Decomposition":[1],"(PoDec)":[2],"is":[3,82,108,140,152],"a":[4,20,32,56,95,100,117,130,136,157,166,169,174],"framework":[5],"that":[6,113,132,160,179],"lessens":[7],"the":[8,25,39,68,77,87,90,111,121,125,149,193],"curse":[9],"of":[10,42,64,67,79,89,127],"dimensionality":[11],"when":[12],"deriving":[13],"policies":[14,43,49,123,195,204],"to":[15,37,72,98,104,135,142,203],"optimal":[16,138,150],"control":[17,29,46],"problems.":[18],"For":[19,165],"given":[21],"system":[22,80,158],"representation,":[23],"i.e.":[24],"state":[26,69],"variables":[27],"and":[28,61,129,173],"inputs":[30,52],"describing":[31],"system,":[33],"PoDec":[34],"generates":[35],"strategies":[36],"decompose":[38],"joint":[40],"optimization":[41],"for":[44,50],"all":[45],"inputs.":[47],"Thereby,":[48],"different":[51],"are":[53],"derived":[54],"in":[55,74,120,183],"decoupled":[57],"or":[58],"cascaded":[59],"fashion":[60],"as":[62,84],"functions":[63],"some":[65],"subsets":[66],"variables,":[70],"leading":[71],"reduction":[73,182],"computation.":[75],"However,":[76],"choice":[78],"representation":[81,101,131,159],"crucial":[83],"it":[85],"dictates":[86],"suboptimality":[88],"resulting":[91,122],"policies.":[92],"We":[93],"present":[94],"heuristic":[96],"method":[97],"find":[99],"more":[102],"amenable":[103],"decomposition.":[105],"Our":[106],"approach":[107],"based":[109],"on":[110],"observation":[112],"every":[114],"decomposition":[115,194],"enforces":[116],"sparsity":[118],"pattern":[119],"at":[124],"cost":[126],"optimality":[128],"already":[133],"leads":[134],"sparse":[137],"policy":[139,151],"likely":[141],"produce":[143,196],"decompositions":[144,178],"with":[145,198],"lower":[146,200],"suboptimalities.":[147],"As":[148],"not":[153],"known":[154],"we":[155,176],"construct":[156],"sparsifies":[161],"its":[162],"LQR":[163],"approximation.":[164],"simplified":[167],"biped,":[168],"4":[170],"degree-of-freedom":[171],"manipulator,":[172],"quadcopter,":[175],"discover":[177],"offer":[180],"10%":[181],"trajectory":[184],"costs":[185,201],"over":[186],"those":[187],"identified":[188],"by":[189],"vanilla":[190],"PoDec.":[191],"Moreover,":[192],"trajectories":[197],"substantially":[199],"compared":[202],"obtained":[205],"from":[206],"state-of-the-art":[207],"reinforcement":[208],"learning":[209],"algorithms.":[210]},"counts_by_year":[{"year":2024,"cited_by_count":1}],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}