{"id":"https://openalex.org/W4400976079","doi":"https://doi.org/10.1109/icca62789.2024.10591821","title":"A Guided-to-Autonomous Policy Learning Method of Deep Reinforcement Learning in Path Planning","display_name":"A Guided-to-Autonomous Policy Learning Method of Deep Reinforcement Learning in Path Planning","publication_year":2024,"publication_date":"2024-06-18","ids":{"openalex":"https://openalex.org/W4400976079","doi":"https://doi.org/10.1109/icca62789.2024.10591821"},"language":"en","primary_location":{"id":"doi:10.1109/icca62789.2024.10591821","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icca62789.2024.10591821","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2024 IEEE 18th International Conference on Control &amp;amp; Automation (ICCA)","raw_type":"proceedings-article"},"type":"conference-paper","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5049592947","display_name":"Wang Zhao","orcid":"https://orcid.org/0009-0000-8707-2370"},"institutions":[{"id":"https://openalex.org/I17145004","display_name":"Northwestern Polytechnical University","ror":"https://ror.org/01y0j0j86","country_code":"CN","type":"education","lineage":["https://openalex.org/I17145004"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Wang Zhao","raw_affiliation_strings":["School of Astronautics, Northwestern Polytechnical University,Xi&#x0027;an,China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"School of Astronautics, Northwestern Polytechnical University,Xi&#x0027;an,China","institution_ids":["https://openalex.org/I17145004"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5101498179","display_name":"Ye Zhang","orcid":"https://orcid.org/0009-0009-5605-3463"},"institutions":[{"id":"https://openalex.org/I17145004","display_name":"Northwestern Polytechnical University","ror":"https://ror.org/01y0j0j86","country_code":"CN","type":"education","lineage":["https://openalex.org/I17145004"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Ye Zhang","raw_affiliation_strings":["School of Astronautics, Northwestern Polytechnical University,Xi&#x0027;an,China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"School of Astronautics, Northwestern Polytechnical University,Xi&#x0027;an,China","institution_ids":["https://openalex.org/I17145004"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5100358570","display_name":"Haoyu Li","orcid":"https://orcid.org/0000-0002-7138-8263"},"institutions":[{"id":"https://openalex.org/I17145004","display_name":"Northwestern Polytechnical University","ror":"https://ror.org/01y0j0j86","country_code":"CN","type":"education","lineage":["https://openalex.org/I17145004"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Haoyu Li","raw_affiliation_strings":["School of Astronautics, Northwestern Polytechnical University,Xi&#x0027;an,China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"School of Astronautics, Northwestern Polytechnical University,Xi&#x0027;an,China","institution_ids":["https://openalex.org/I17145004"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":[],"corresponding_institution_ids":["https://openalex.org/I17145004"],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":2,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"665","last_page":"672"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10586","display_name":"Robotic Path Planning Algorithms","score":0.7372000217437744,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10586","display_name":"Robotic Path Planning Algorithms","score":0.7372000217437744,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T14098","display_name":"Energy Efficiency in Computing","score":0.6444000005722046,"subfield":{"id":"https://openalex.org/subfields/1708","display_name":"Hardware and Architecture"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.8991632461547852},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7410683631896973},{"id":"https://openalex.org/keywords/motion-planning","display_name":"Motion planning","score":0.6293010711669922},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.593745231628418},{"id":"https://openalex.org/keywords/path","display_name":"Path (computing)","score":0.5234153270721436},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.3717242479324341},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.15276941657066345},{"id":"https://openalex.org/keywords/computer-network","display_name":"Computer network","score":0.058589011430740356}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.8991632461547852},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7410683631896973},{"id":"https://openalex.org/C81074085","wikidata":"https://www.wikidata.org/wiki/Q366872","display_name":"Motion planning","level":3,"score":0.6293010711669922},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.593745231628418},{"id":"https://openalex.org/C2777735758","wikidata":"https://www.wikidata.org/wiki/Q817765","display_name":"Path (computing)","level":2,"score":0.5234153270721436},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3717242479324341},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.15276941657066345},{"id":"https://openalex.org/C31258907","wikidata":"https://www.wikidata.org/wiki/Q1301371","display_name":"Computer network","level":1,"score":0.058589011430740356}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/icca62789.2024.10591821","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icca62789.2024.10591821","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2024 IEEE 18th International Conference on Control &amp;amp; Automation (ICCA)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[{"id":"https://openalex.org/G1739416371","display_name":null,"funder_award_id":"52202502","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"}],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"}],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":23,"referenced_works":["https://openalex.org/W2913938871","https://openalex.org/W2963129648","https://openalex.org/W2963809389","https://openalex.org/W2963864421","https://openalex.org/W3104753760","https://openalex.org/W3130777366","https://openalex.org/W3132175036","https://openalex.org/W3133988851","https://openalex.org/W3138919713","https://openalex.org/W3153752809","https://openalex.org/W4214735187","https://openalex.org/W4293198193","https://openalex.org/W4310297558","https://openalex.org/W4319068706","https://openalex.org/W4382365501","https://openalex.org/W4382877619","https://openalex.org/W4383112356","https://openalex.org/W4383742735","https://openalex.org/W4385335989","https://openalex.org/W4385453581","https://openalex.org/W4386003505","https://openalex.org/W6684921986","https://openalex.org/W6692846177"],"related_works":["https://openalex.org/W2961085424","https://openalex.org/W4306674287","https://openalex.org/W3046775127","https://openalex.org/W3107602296","https://openalex.org/W4394896187","https://openalex.org/W3170094116","https://openalex.org/W4386462264","https://openalex.org/W4364306694","https://openalex.org/W4312192474","https://openalex.org/W4283697347"],"abstract_inverted_index":{"This":[0],"study":[1],"introduces":[2],"a":[3,37,101,136],"Guided-to-Autonomous":[4,65],"Policy":[5],"Learning":[6,20],"(GAPL)":[7],"method":[8,146],"that":[9,105],"improves":[10],"the":[11,31,56,64,72,86,90,111,116,144,163],"training":[12,59,77,141,166],"efficiency":[13,78,167],"and":[14,48,113,125,159],"composite":[15,80,107,149],"optimization":[16,81,150],"of":[17,33,58,75,89,165],"Deep":[18],"Reinforcement":[19],"(DRL)":[21],"in":[22,85,121,139,168],"path":[23,153],"planning.":[24],"Under":[25],"this":[26],"method,":[27],"firstly,":[28],"we":[29],"introduce":[30],"concept":[32],"guiding":[34,96,133],"rewards":[35,104,134],"as":[36],"reward":[38,91],"enhancement":[39],"mechanism,":[40],"which,":[41],"based":[42],"on":[43,103],"Rapidly-exploring":[44],"Random":[45],"Trees":[46],"(RRT)":[47],"Artificial":[49],"Potential":[50],"Field":[51],"(APF)":[52],"algorithm,":[53],"effectively":[54,161],"addresses":[55,162],"challenge":[57],"efficiency.":[60],"We":[61],"then":[62],"propose":[63],"Reward":[66],"Transition":[67],"(GART)":[68],"model":[69],"to":[70,115,156],"solve":[71],"combined":[73],"challenges":[74],"balancing":[76],"with":[79],"problems,":[82],"which":[83],"lies":[84],"evolutionary":[87],"refinement":[88],"structure,":[92],"initially":[93],"dominated":[94],"by":[95],"rewards,":[97],"transiting":[98],"progressively":[99],"toward":[100],"focus":[102],"emphasize":[106],"optimization,":[108],"specifically":[109],"minimizing":[110],"distance":[112],"time":[114],"end":[117],"point.":[118],"Simulated":[119],"experiments":[120],"static":[122],"obstacle":[123,128],"settings":[124],"mixed":[126],"dynamic-static":[127],"environments":[129],"demonstrate":[130],"that:":[131],"1)":[132],"play":[135],"significant":[137],"role":[138],"enhancing":[140],"efficiency;":[142],"2)":[143],"GAPL":[145],"yields":[147],"superior":[148],"outcomes":[151],"for":[152],"planning":[154],"compared":[155],"conventional":[157,169],"methods,":[158],"it":[160],"issue":[164],"DRL":[170],"method.":[171]},"counts_by_year":[{"year":2025,"cited_by_count":2}],"updated_date":"2026-07-14T23:27:15.235271","created_date":"2025-10-10T00:00:00"}