{"id":"https://openalex.org/W7156286454","doi":"https://doi.org/10.48550/arxiv.2604.22724","title":"GCImOpt: Learning efficient goal-conditioned policies by imitating optimal trajectories","display_name":"GCImOpt: Learning efficient goal-conditioned policies by imitating optimal trajectories","publication_year":2026,"publication_date":"2026-04-24","ids":{"openalex":"https://openalex.org/W7156286454","doi":"https://doi.org/10.48550/arxiv.2604.22724"},"language":null,"primary_location":{"id":"doi:10.48550/arxiv.2604.22724","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.22724","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2604.22724","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5134672804","display_name":"Jon Goikoetxea","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Goikoetxea, Jon","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5134685022","display_name":"Jes\u00fas F. Palaci\u00e1n","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Palaci\u00e1n, Jes\u00fas F.","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.20170000195503235,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.20170000195503235,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10653","display_name":"Robot Manipulation and Learning","score":0.12370000034570694,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11206","display_name":"Model Reduction and Neural Networks","score":0.0949999988079071,"subfield":{"id":"https://openalex.org/subfields/3109","display_name":"Statistical and Nonlinear Physics"},"field":{"id":"https://openalex.org/fields/31","display_name":"Physics and Astronomy"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/trajectory","display_name":"Trajectory","score":0.6861000061035156},{"id":"https://openalex.org/keywords/laptop","display_name":"Laptop","score":0.5960000157356262},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.5936999917030334},{"id":"https://openalex.org/keywords/generality","display_name":"Generality","score":0.548799991607666},{"id":"https://openalex.org/keywords/scheme","display_name":"Scheme (mathematics)","score":0.5460000038146973},{"id":"https://openalex.org/keywords/quadcopter","display_name":"Quadcopter","score":0.5300999879837036},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.5023000240325928},{"id":"https://openalex.org/keywords/point","display_name":"Point (geometry)","score":0.49900001287460327},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.412200003862381}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7850000262260437},{"id":"https://openalex.org/C13662910","wikidata":"https://www.wikidata.org/wiki/Q193139","display_name":"Trajectory","level":2,"score":0.6861000061035156},{"id":"https://openalex.org/C2780008327","wikidata":"https://www.wikidata.org/wiki/Q3962","display_name":"Laptop","level":2,"score":0.5960000157356262},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.5936999917030334},{"id":"https://openalex.org/C2780767217","wikidata":"https://www.wikidata.org/wiki/Q5532421","display_name":"Generality","level":2,"score":0.548799991607666},{"id":"https://openalex.org/C77618280","wikidata":"https://www.wikidata.org/wiki/Q1155772","display_name":"Scheme (mathematics)","level":2,"score":0.5460000038146973},{"id":"https://openalex.org/C2779199153","wikidata":"https://www.wikidata.org/wiki/Q43965","display_name":"Quadcopter","level":2,"score":0.5300999879837036},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.5023000240325928},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.49970000982284546},{"id":"https://openalex.org/C28719098","wikidata":"https://www.wikidata.org/wiki/Q44946","display_name":"Point (geometry)","level":2,"score":0.49900001287460327},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.412200003862381},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.40369999408721924},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.39160001277923584},{"id":"https://openalex.org/C2777211547","wikidata":"https://www.wikidata.org/wiki/Q17141490","display_name":"Training (meteorology)","level":2,"score":0.36410000920295715},{"id":"https://openalex.org/C173246807","wikidata":"https://www.wikidata.org/wiki/Q7833062","display_name":"Trajectory optimization","level":3,"score":0.36309999227523804},{"id":"https://openalex.org/C91575142","wikidata":"https://www.wikidata.org/wiki/Q1971426","display_name":"Optimal control","level":2,"score":0.3474000096321106},{"id":"https://openalex.org/C2777904410","wikidata":"https://www.wikidata.org/wiki/Q7397","display_name":"Software","level":2,"score":0.33480000495910645},{"id":"https://openalex.org/C114466953","wikidata":"https://www.wikidata.org/wiki/Q6034165","display_name":"Initialization","level":2,"score":0.30000001192092896},{"id":"https://openalex.org/C126388530","wikidata":"https://www.wikidata.org/wiki/Q1131737","display_name":"Imitation","level":2,"score":0.2937999963760376},{"id":"https://openalex.org/C34413123","wikidata":"https://www.wikidata.org/wiki/Q170978","display_name":"Robotics","level":3,"score":0.2847000062465668},{"id":"https://openalex.org/C108583219","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep learning","level":2,"score":0.26649999618530273},{"id":"https://openalex.org/C2984842247","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep neural networks","level":3,"score":0.2662999927997589},{"id":"https://openalex.org/C149810388","wikidata":"https://www.wikidata.org/wiki/Q5374873","display_name":"Emulation","level":2,"score":0.2660999894142151},{"id":"https://openalex.org/C202615002","wikidata":"https://www.wikidata.org/wiki/Q783507","display_name":"Differentiable function","level":2,"score":0.26260000467300415},{"id":"https://openalex.org/C79403827","wikidata":"https://www.wikidata.org/wiki/Q3988","display_name":"Real-time computing","level":1,"score":0.259799987077713},{"id":"https://openalex.org/C51632099","wikidata":"https://www.wikidata.org/wiki/Q3985153","display_name":"Training set","level":2,"score":0.2581000030040741}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2604.22724","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.22724","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2604.22724","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2604.22724","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Imitation":[0],"learning":[1],"is":[2,56],"a":[3,68,79,151,191,212],"well-established":[4],"approach":[5,37,52],"for":[6,26,53,135],"machine-learning-based":[7],"control.":[8],"However,":[9],"its":[10],"applicability":[11],"depends":[12],"on":[13,45,67],"having":[14],"access":[15],"to":[16,22,38,92,184],"demonstrations,":[17],"which":[18],"are":[19,90],"often":[20],"expensive":[21],"collect":[23],"and/or":[24],"suboptimal":[25],"solving":[27],"the":[28,94,116,123],"task.":[29],"In":[30],"this":[31],"work,":[32],"we":[33,89,107,128],"present":[34],"GCImOpt,":[35],"an":[36,99],"learn":[39],"efficient":[40],"goal-conditioned":[41,109],"policies":[42,112,134,160,210],"by":[43,48,76,98],"training":[44,95],"datasets":[46,130,207],"generated":[47,105],"trajectory":[49,192],"optimization.":[50],"Our":[51],"dataset":[54,96],"generation":[55],"computationally":[57],"efficient,":[58],"can":[59,114,161],"generate":[60,129],"thousands":[61],"of":[62,78,101,125],"optimal":[63],"trajectories":[64],"in":[65],"minutes":[66],"laptop":[69],"computer,":[70],"and":[71,131,143,147,166,180,208],"produces":[72],"high-quality":[73],"demonstrations.":[74],"Further,":[75],"means":[77],"data":[80],"augmentation":[81],"scheme":[82],"that":[83,113,157,195],"treats":[84],"intermediate":[85],"states":[86],"as":[87],"goals,":[88],"able":[91],"increase":[93],"size":[97],"order":[100],"magnitude.":[102],"Using":[103],"our":[104,126,158,217],"datasets,":[106],"train":[108,133],"neural":[110,177],"network":[111,178],"control":[115,137,168],"system":[117],"towards":[118],"arbitrary":[119],"goals.":[120],"To":[121],"demonstrate":[122],"generality":[124],"approach,":[127],"then":[132],"various":[136],"tasks,":[138],"namely":[139],"cart-pole":[140],"stabilization,":[141,146],"planar":[142],"three-dimensional":[144],"quadcopter":[145],"point":[148],"reaching":[149],"using":[150],"6-DoF":[152],"robot":[153],"arm.":[154],"We":[155,203],"show":[156],"trained":[159],"achieve":[162],"high":[163],"success":[164],"rates":[165],"near-optimal":[167],"profiles,":[169],"all":[170],"while":[171],"being":[172],"small":[173],"(less":[174],"than":[175,186,190],"80,000":[176],"parameters)":[179],"fast":[181],"enough":[182],"(up":[183],"more":[185],"6,000":[187],"times":[188],"faster":[189],"optimization":[193],"solver)":[194],"they":[196],"could":[197],"be":[198],"deployed":[199],"onboard":[200],"resource-constrained":[201],"controllers.":[202],"provide":[204],"videos,":[205],"code,":[206],"pre-trained":[209],"under":[211],"free":[213],"software":[214],"license;":[215],"see":[216],"project":[218],"website":[219],"https://jongoiko.github.io/gcimopt/.":[220]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-04-28T00:00:00"}