{"id":"https://openalex.org/W7139111337","doi":"https://doi.org/10.48550/arxiv.2603.17092","title":"SLowRL: Safe Low-Rank Adaptation Reinforcement Learning for Locomotion","display_name":"SLowRL: Safe Low-Rank Adaptation Reinforcement Learning for Locomotion","publication_year":2026,"publication_date":"2026-03-17","ids":{"openalex":"https://openalex.org/W7139111337","doi":"https://doi.org/10.48550/arxiv.2603.17092"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2603.17092","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.17092","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2603.17092","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5030066870","display_name":"Elham Daneshmand","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Daneshmand, Elham","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5130007510","display_name":"Shafeef Omar","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Omar, Shafeef","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5130158866","display_name":"Glen Berseth","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Berseth, Glen","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5043216529","display_name":"Majid Khadiv","orcid":"https://orcid.org/0000-0001-9889-6543"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Khadiv, Majid","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5129947533","display_name":"Hsiu-Chin Lin","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Lin, Hsiu-Chin","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":5,"corresponding_author_ids":["https://openalex.org/A5030066870"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10879","display_name":"Robotic Locomotion and Control","score":0.4120999872684479,"subfield":{"id":"https://openalex.org/subfields/2204","display_name":"Biomedical Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10879","display_name":"Robotic Locomotion and Control","score":0.4120999872684479,"subfield":{"id":"https://openalex.org/subfields/2204","display_name":"Biomedical Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.3544999957084656,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11023","display_name":"Prosthetics and Rehabilitation Robotics","score":0.05299999937415123,"subfield":{"id":"https://openalex.org/subfields/2204","display_name":"Biomedical Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.785099983215332},{"id":"https://openalex.org/keywords/adaptation","display_name":"Adaptation (eye)","score":0.6977999806404114},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.5085999965667725},{"id":"https://openalex.org/keywords/focus","display_name":"Focus (optics)","score":0.5056999921798706},{"id":"https://openalex.org/keywords/reduction","display_name":"Reduction (mathematics)","score":0.436599999666214},{"id":"https://openalex.org/keywords/reinforcement","display_name":"Reinforcement","score":0.351500004529953}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.785099983215332},{"id":"https://openalex.org/C139807058","wikidata":"https://www.wikidata.org/wiki/Q352374","display_name":"Adaptation (eye)","level":2,"score":0.6977999806404114},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6796000003814697},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.5085999965667725},{"id":"https://openalex.org/C192209626","wikidata":"https://www.wikidata.org/wiki/Q190909","display_name":"Focus (optics)","level":2,"score":0.5056999921798706},{"id":"https://openalex.org/C111335779","wikidata":"https://www.wikidata.org/wiki/Q3454686","display_name":"Reduction (mathematics)","level":2,"score":0.436599999666214},{"id":"https://openalex.org/C67203356","wikidata":"https://www.wikidata.org/wiki/Q1321905","display_name":"Reinforcement","level":2,"score":0.351500004529953},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.33959999680519104},{"id":"https://openalex.org/C2779777834","wikidata":"https://www.wikidata.org/wiki/Q4202277","display_name":"Enforcement","level":2,"score":0.33889999985694885},{"id":"https://openalex.org/C198531522","wikidata":"https://www.wikidata.org/wiki/Q485146","display_name":"Sample (material)","level":2,"score":0.33709999918937683},{"id":"https://openalex.org/C77618280","wikidata":"https://www.wikidata.org/wiki/Q1155772","display_name":"Scheme (mathematics)","level":2,"score":0.32199999690055847},{"id":"https://openalex.org/C2780695682","wikidata":"https://www.wikidata.org/wiki/Q4005959","display_name":"Jump","level":2,"score":0.3043000102043152},{"id":"https://openalex.org/C44154836","wikidata":"https://www.wikidata.org/wiki/Q45045","display_name":"Simulation","level":1,"score":0.2892000079154968},{"id":"https://openalex.org/C2780586882","wikidata":"https://www.wikidata.org/wiki/Q7520643","display_name":"Simple (philosophy)","level":2,"score":0.259799987077713},{"id":"https://openalex.org/C133731056","wikidata":"https://www.wikidata.org/wiki/Q4917288","display_name":"Control engineering","level":1,"score":0.25699999928474426}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2603.17092","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.17092","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2603.17092","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.17092","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Sim-to-real":[0],"transfer":[1],"of":[2,29,45,171],"locomotion":[3,56],"policies":[4,19,53,63],"often":[5],"leads":[6],"to":[7,11,134,151],"performance":[8,154],"degradation":[9],"due":[10],"the":[12,43,156,169],"inevitable":[13],"sim-to-real":[14],"gap.":[15],"Naively":[16],"fine-tuning":[17,49,62,127,174],"these":[18],"directly":[20,67],"on":[21,61,68,104],"hardware":[22],"is":[23,149],"problematic,":[24],"as":[25],"it":[26],"poses":[27],"risks":[28],"mechanical":[30],"failure":[31],"and":[32,47,103,113,129,162],"suffers":[33],"from":[34],"high":[35],"sample":[36],"inefficiency.":[37],"In":[38,75],"this":[39],"paper,":[40],"we":[41,59,78,142],"address":[42],"challenge":[44],"safely":[46],"efficiently":[48],"reinforcement":[50],"learning":[51],"(RL)":[52],"for":[54,111,175],"dynamic":[55,176],"tasks.":[57,115],"Specifically,":[58],"focus":[60],"learned":[64],"in":[65,101,126,155],"simulation":[66,102],"hardware,":[69],"while":[70,159],"explicitly":[71],"enforcing":[72],"safety":[73,90,131],"constraints.":[74],"doing":[76],"so,":[77],"introduce":[79],"SLowRL,":[80],"a":[81,93,105,123,145],"framework":[82],"that":[83,119,144],"combines":[84],"Low-Rank":[85],"Adaptation":[86],"(LoRA)":[87],"with":[88],"training-time":[89],"enforcement":[91],"via":[92],"recovery":[94],"policy.":[95],"We":[96],"evaluate":[97],"our":[98,120],"method":[99,121],"both":[100],"real":[106,157],"Unitree":[107],"Go2":[108],"quadruped":[109],"robot":[110],"jump":[112],"trot":[114],"Experimental":[116],"results":[117,167],"show":[118],"achieves":[122],"$46.5\\%$":[124],"reduction":[125],"time":[128],"near-zero":[130],"violations":[132],"compared":[133],"standard":[135],"proximal":[136],"policy":[137],"optimization":[138],"(PPO)":[139],"baselines.":[140],"Notably,":[141],"find":[143],"rank-1":[146],"adaptation":[147],"alone":[148],"sufficient":[150],"recover":[152],"pre-trained":[153],"world,":[158],"maintaining":[160],"stable":[161],"safe":[163],"real-world":[164,177],"fine-tuning.":[165],"These":[166],"demonstrate":[168],"practicality":[170],"safe,":[172],"efficient":[173],"robotic":[178],"applications.":[179]},"counts_by_year":[],"updated_date":"2026-05-05T08:41:31.759640","created_date":"2026-03-20T00:00:00"}