{"id":"https://openalex.org/W6968616357","doi":"https://doi.org/10.5281/zenodo.5879654","title":"Zero-Shot Policy Transfer in Autonomous Racing:Reinforcement Learning vs Imitation Learning","display_name":"Zero-Shot Policy Transfer in Autonomous Racing:Reinforcement Learning vs Imitation Learning","publication_year":2022,"publication_date":"2022-01-19","ids":{"openalex":"https://openalex.org/W6968616357","doi":"https://doi.org/10.5281/zenodo.5879654"},"language":"en","primary_location":{"id":"doi:10.5281/zenodo.5879654","is_oa":true,"landing_page_url":"https://doi.org/10.5281/zenodo.5879654","pdf_url":null,"source":{"id":"https://openalex.org/S4306400562","display_name":"Zenodo (CERN European Organization for Nuclear Research)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I67311998","host_organization_name":"European Organization for Nuclear Research","host_organization_lineage":["https://openalex.org/I67311998"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Software"},"type":"software","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.5281/zenodo.5879654","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":null,"display_name":"Hamilton, Nathaniel","orcid":"https://orcid.org/0000-0002-7147-1964"},"institutions":[{"id":"https://openalex.org/I200719446","display_name":"Vanderbilt University","ror":"https://ror.org/02vm5rt34","country_code":"US","type":"education","lineage":["https://openalex.org/I200719446"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Hamilton, Nathaniel","raw_affiliation_strings":["Vanderbilt University"],"raw_orcid":"https://orcid.org/0000-0002-7147-1964","affiliations":[{"raw_affiliation_string":"Vanderbilt University","institution_ids":["https://openalex.org/I200719446"]}]},{"author_position":"middle","author":{"id":null,"display_name":"Musau, Patrick","orcid":"https://orcid.org/0000-0002-0227-1336"},"institutions":[{"id":"https://openalex.org/I200719446","display_name":"Vanderbilt University","ror":"https://ror.org/02vm5rt34","country_code":"US","type":"education","lineage":["https://openalex.org/I200719446"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Musau, Patrick","raw_affiliation_strings":["Vanderbilt University"],"raw_orcid":"https://orcid.org/0000-0002-0227-1336","affiliations":[{"raw_affiliation_string":"Vanderbilt University","institution_ids":["https://openalex.org/I200719446"]}]},{"author_position":"middle","author":{"id":null,"display_name":"Lopez, Diego Manzanas","orcid":"https://orcid.org/0000-0003-0721-1241"},"institutions":[{"id":"https://openalex.org/I200719446","display_name":"Vanderbilt University","ror":"https://ror.org/02vm5rt34","country_code":"US","type":"education","lineage":["https://openalex.org/I200719446"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Lopez, Diego Manzanas","raw_affiliation_strings":["Vanderbilt University"],"raw_orcid":"https://orcid.org/0000-0003-0721-1241","affiliations":[{"raw_affiliation_string":"Vanderbilt University","institution_ids":["https://openalex.org/I200719446"]}]},{"author_position":"last","author":{"id":null,"display_name":"Johnson, Taylor T","orcid":"https://orcid.org/0000-0001-8021-9923"},"institutions":[{"id":"https://openalex.org/I200719446","display_name":"Vanderbilt University","ror":"https://ror.org/02vm5rt34","country_code":"US","type":"education","lineage":["https://openalex.org/I200719446"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Johnson, Taylor T","raw_affiliation_strings":["Vanderbilt University"],"raw_orcid":"https://orcid.org/0000-0001-8021-9923","affiliations":[{"raw_affiliation_string":"Vanderbilt University","institution_ids":["https://openalex.org/I200719446"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":[],"corresponding_institution_ids":["https://openalex.org/I200719446"],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":true,"primary_topic":null,"topics":[],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7559000253677368},{"id":"https://openalex.org/keywords/imitation","display_name":"Imitation","score":0.7260000109672546},{"id":"https://openalex.org/keywords/reliability","display_name":"Reliability (semiconductor)","score":0.5702000260353088},{"id":"https://openalex.org/keywords/transfer-of-learning","display_name":"Transfer of learning","score":0.5394999980926514},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.43560001254081726},{"id":"https://openalex.org/keywords/adaptation","display_name":"Adaptation (eye)","score":0.3817000091075897}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7559000253677368},{"id":"https://openalex.org/C126388530","wikidata":"https://www.wikidata.org/wiki/Q1131737","display_name":"Imitation","level":2,"score":0.7260000109672546},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5949000120162964},{"id":"https://openalex.org/C43214815","wikidata":"https://www.wikidata.org/wiki/Q7310987","display_name":"Reliability (semiconductor)","level":3,"score":0.5702000260353088},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5591999888420105},{"id":"https://openalex.org/C150899416","wikidata":"https://www.wikidata.org/wiki/Q1820378","display_name":"Transfer of learning","level":2,"score":0.5394999980926514},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.4546000063419342},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.43560001254081726},{"id":"https://openalex.org/C139807058","wikidata":"https://www.wikidata.org/wiki/Q352374","display_name":"Adaptation (eye)","level":2,"score":0.3817000091075897},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.32010000944137573},{"id":"https://openalex.org/C2779436431","wikidata":"https://www.wikidata.org/wiki/Q30672407","display_name":"Policy learning","level":2,"score":0.31290000677108765},{"id":"https://openalex.org/C127413603","wikidata":"https://www.wikidata.org/wiki/Q11023","display_name":"Engineering","level":0,"score":0.29660001397132874},{"id":"https://openalex.org/C2777211547","wikidata":"https://www.wikidata.org/wiki/Q17141490","display_name":"Training (meteorology)","level":2,"score":0.27709999680519104},{"id":"https://openalex.org/C67203356","wikidata":"https://www.wikidata.org/wiki/Q1321905","display_name":"Reinforcement","level":2,"score":0.25839999318122864},{"id":"https://openalex.org/C10431821","wikidata":"https://www.wikidata.org/wiki/Q6510174","display_name":"Learning effect","level":2,"score":0.2531999945640564}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.5281/zenodo.5879654","is_oa":true,"landing_page_url":"https://doi.org/10.5281/zenodo.5879654","pdf_url":null,"source":{"id":"https://openalex.org/S4306400562","display_name":"Zenodo (CERN European Organization for Nuclear Research)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I67311998","host_organization_name":"European Organization for Nuclear Research","host_organization_lineage":["https://openalex.org/I67311998"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"Software"}],"best_oa_location":{"id":"doi:10.5281/zenodo.5879654","is_oa":true,"landing_page_url":"https://doi.org/10.5281/zenodo.5879654","pdf_url":null,"source":{"id":"https://openalex.org/S4306400562","display_name":"Zenodo (CERN European Organization for Nuclear Research)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I67311998","host_organization_name":"European Organization for Nuclear Research","host_organization_lineage":["https://openalex.org/I67311998"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Software"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Repeatability":[0],"package":[1],"for:":[2],"\"Zero-Shot":[3],"Policy":[4],"Transfer":[5],"in":[6,22,47,56,62,114,132,160],"Autonomous":[7,50],"Racing:Reinforcement":[8],"Learning":[9,93],"vs":[10],"Imitation":[11,95],"Learning\"":[12],"There":[13],"are":[14,71,177],"few":[15],"technologies":[16],"that":[17,57,70,140],"hold":[18],"as":[19,29,33],"much":[20],"promise":[21],"achieving":[23],"safe,":[24],"accessible,":[25],"and":[26,39,94,110,134],"convenient":[27],"transportation":[28],"autonomous":[30,99],"vehicles.":[31],"However,":[32,163],"recent":[34],"years":[35],"have":[36],"demonstrated,":[37],"safety":[38,111],"reliability":[40],"remain":[41,145],"the":[42,98,150,164,169],"most":[43,161],"obstinate":[44],"challenges,":[45],"especially":[46],"complex":[48],"domains.":[49],"racing":[51,100],"has":[52],"demonstrated":[53],"unique":[54],"benefits":[55],"researchers":[58],"can":[59],"conduct":[60],"research":[61],"controlled":[63],"environments,":[64],"allowing":[65],"for":[66,87,97],"experimentation":[67],"with":[68],"approaches":[69],"too":[72],"risky":[73],"to":[74,149],"evaluate":[75],"on":[76,135],"public":[77],"roads.":[78],"In":[79],"this":[80],"work,":[81],"we":[82],"compare":[83,103],"two":[84],"leading":[85],"methods":[86,176],"training":[88,119],"neural":[89],"network":[90],"controllers,":[91],"Reinforcement":[92],"Learning,":[96],"task.":[101],"We":[102],"their":[104,108,118],"viability":[105],"by":[106],"analyzing":[107],"performance":[109,166],"when":[112,147],"deployed":[113],"novel":[115],"scenarios":[116],"outside":[117],"via":[120],"zero-shot":[121],"policy":[122],"transfer.":[123],"Our":[124,152],"evaluation":[125],"is":[126],"made":[127],"up":[128],"of":[129,171],"numerous":[130],"experiments":[131],"simulation":[133],"our":[136],"real-world":[137],"hardware":[138],"platform":[139],"analyze":[141],"whether":[142],"these":[143],"algorithms":[144],"effective":[146,178],"transferred":[148],"real-world.":[151],"results":[153],"show":[154],"reinforcement":[155],"learning":[156,159],"outperforming":[157],"imitation":[158],"scenarios.":[162],"increased":[165],"comes":[167],"at":[168],"cost":[170],"reduced":[172],"safety.":[173],"Thus,":[174],"both":[175],"under":[179],"different":[180],"criteria.":[181]},"counts_by_year":[],"updated_date":"2026-07-01T06:00:48.157686","created_date":"2025-10-10T00:00:00"}