{"id":"https://openalex.org/W4415335121","doi":"https://doi.org/10.20965/jrm.2025.p1024","title":"Application and Experimental Verification of a Delay-Aware Deep Reinforcement Learning Method in End-to-End Autonomous Driving Control","display_name":"Application and Experimental Verification of a Delay-Aware Deep Reinforcement Learning Method in End-to-End Autonomous Driving Control","publication_year":2025,"publication_date":"2025-10-19","ids":{"openalex":"https://openalex.org/W4415335121","doi":"https://doi.org/10.20965/jrm.2025.p1024"},"language":"en","primary_location":{"id":"doi:10.20965/jrm.2025.p1024","is_oa":true,"landing_page_url":"https://doi.org/10.20965/jrm.2025.p1024","pdf_url":null,"source":{"id":"https://openalex.org/S2764886168","display_name":"Journal of Robotics and Mechatronics","issn_l":"0915-3942","issn":["0915-3942","1883-8049"],"is_oa":true,"is_in_doaj":true,"is_core":true,"host_organization":"https://openalex.org/P4324309662","host_organization_name":"Fuji Technology Press Ltd.","host_organization_lineage":["https://openalex.org/P4324309662"],"host_organization_lineage_names":["Fuji Technology Press Ltd."],"type":"journal"},"license":"cc-by-nd","license_id":"https://openalex.org/licenses/cc-by-nd","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Journal of Robotics and Mechatronics","raw_type":"journal-article"},"type":"article","indexed_in":["crossref","doaj"],"open_access":{"is_oa":true,"oa_status":"diamond","oa_url":"https://doi.org/10.20965/jrm.2025.p1024","any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5120057601","display_name":"Kazuya Emura","orcid":null},"institutions":[{"id":"https://openalex.org/I161296585","display_name":"Tokyo University of Science","ror":"https://ror.org/05sj3n476","country_code":"JP","type":"education","lineage":["https://openalex.org/I161296585"]}],"countries":["JP"],"is_corresponding":false,"raw_author_name":"Kazuya Emura","raw_affiliation_strings":["Tokyo University of Science, 6-3-1 Niijuku, Katsushika-ku, Tokyo 125-8585, Japan"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Tokyo University of Science, 6-3-1 Niijuku, Katsushika-ku, Tokyo 125-8585, Japan","institution_ids":["https://openalex.org/I161296585"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5111367961","display_name":"Ryuzo HAYASHI","orcid":null},"institutions":[{"id":"https://openalex.org/I161296585","display_name":"Tokyo University of Science","ror":"https://ror.org/05sj3n476","country_code":"JP","type":"education","lineage":["https://openalex.org/I161296585"]}],"countries":["JP"],"is_corresponding":false,"raw_author_name":"Ryuzo Hayashi","raw_affiliation_strings":["Tokyo University of Science, 6-3-1 Niijuku, Katsushika-ku, Tokyo 125-8585, Japan"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Tokyo University of Science, 6-3-1 Niijuku, Katsushika-ku, Tokyo 125-8585, Japan","institution_ids":["https://openalex.org/I161296585"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.28129413,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":"37","issue":"5","first_page":"1024","last_page":"1033"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11099","display_name":"Autonomous Vehicle Technology and Safety","score":0.9988999962806702,"subfield":{"id":"https://openalex.org/subfields/2203","display_name":"Automotive Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11099","display_name":"Autonomous Vehicle Technology and Safety","score":0.9988999962806702,"subfield":{"id":"https://openalex.org/subfields/2203","display_name":"Automotive Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9970999956130981,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10524","display_name":"Traffic control and management","score":0.9932000041007996,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7246000170707703},{"id":"https://openalex.org/keywords/obstacle","display_name":"Obstacle","score":0.5874000191688538},{"id":"https://openalex.org/keywords/latency","display_name":"Latency (audio)","score":0.5738000273704529},{"id":"https://openalex.org/keywords/reliability","display_name":"Reliability (semiconductor)","score":0.5730999708175659},{"id":"https://openalex.org/keywords/compensation","display_name":"Compensation (psychology)","score":0.5526999831199646},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.5078999996185303},{"id":"https://openalex.org/keywords/process","display_name":"Process (computing)","score":0.4959999918937683},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.4253000020980835}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7317000031471252},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7246000170707703},{"id":"https://openalex.org/C2776650193","wikidata":"https://www.wikidata.org/wiki/Q264661","display_name":"Obstacle","level":2,"score":0.5874000191688538},{"id":"https://openalex.org/C82876162","wikidata":"https://www.wikidata.org/wiki/Q17096504","display_name":"Latency (audio)","level":2,"score":0.5738000273704529},{"id":"https://openalex.org/C43214815","wikidata":"https://www.wikidata.org/wiki/Q7310987","display_name":"Reliability (semiconductor)","level":3,"score":0.5730999708175659},{"id":"https://openalex.org/C2780023022","wikidata":"https://www.wikidata.org/wiki/Q1338171","display_name":"Compensation (psychology)","level":2,"score":0.5526999831199646},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.5078999996185303},{"id":"https://openalex.org/C98045186","wikidata":"https://www.wikidata.org/wiki/Q205663","display_name":"Process (computing)","level":2,"score":0.4959999918937683},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.4253000020980835},{"id":"https://openalex.org/C6683253","wikidata":"https://www.wikidata.org/wiki/Q7075535","display_name":"Obstacle avoidance","level":4,"score":0.4108000099658966},{"id":"https://openalex.org/C26517878","wikidata":"https://www.wikidata.org/wiki/Q228039","display_name":"Key (lock)","level":2,"score":0.3970000147819519},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.39250001311302185},{"id":"https://openalex.org/C47446073","wikidata":"https://www.wikidata.org/wiki/Q5165890","display_name":"Control theory (sociology)","level":3,"score":0.3743000030517578},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.3659000098705292},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.3441999852657318},{"id":"https://openalex.org/C44154836","wikidata":"https://www.wikidata.org/wiki/Q45045","display_name":"Simulation","level":1,"score":0.3224000036716461},{"id":"https://openalex.org/C133731056","wikidata":"https://www.wikidata.org/wiki/Q4917288","display_name":"Control engineering","level":1,"score":0.31619998812675476},{"id":"https://openalex.org/C10431821","wikidata":"https://www.wikidata.org/wiki/Q6510174","display_name":"Learning effect","level":2,"score":0.31459999084472656},{"id":"https://openalex.org/C189950617","wikidata":"https://www.wikidata.org/wiki/Q937228","display_name":"Property (philosophy)","level":2,"score":0.30979999899864197},{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.30640000104904175},{"id":"https://openalex.org/C2778755073","wikidata":"https://www.wikidata.org/wiki/Q10858537","display_name":"Scale (ratio)","level":2,"score":0.2824000120162964},{"id":"https://openalex.org/C79487989","wikidata":"https://www.wikidata.org/wiki/Q934680","display_name":"Vehicle dynamics","level":2,"score":0.2653000056743622},{"id":"https://openalex.org/C46637626","wikidata":"https://www.wikidata.org/wiki/Q6693015","display_name":"Low latency (capital markets)","level":2,"score":0.26429998874664307},{"id":"https://openalex.org/C2984634286","wikidata":"https://www.wikidata.org/wiki/Q1331926","display_name":"Decision process","level":2,"score":0.2556000053882599}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.20965/jrm.2025.p1024","is_oa":true,"landing_page_url":"https://doi.org/10.20965/jrm.2025.p1024","pdf_url":null,"source":{"id":"https://openalex.org/S2764886168","display_name":"Journal of Robotics and Mechatronics","issn_l":"0915-3942","issn":["0915-3942","1883-8049"],"is_oa":true,"is_in_doaj":true,"is_core":true,"host_organization":"https://openalex.org/P4324309662","host_organization_name":"Fuji Technology Press Ltd.","host_organization_lineage":["https://openalex.org/P4324309662"],"host_organization_lineage_names":["Fuji Technology Press Ltd."],"type":"journal"},"license":"cc-by-nd","license_id":"https://openalex.org/licenses/cc-by-nd","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Journal of Robotics and Mechatronics","raw_type":"journal-article"}],"best_oa_location":{"id":"doi:10.20965/jrm.2025.p1024","is_oa":true,"landing_page_url":"https://doi.org/10.20965/jrm.2025.p1024","pdf_url":null,"source":{"id":"https://openalex.org/S2764886168","display_name":"Journal of Robotics and Mechatronics","issn_l":"0915-3942","issn":["0915-3942","1883-8049"],"is_oa":true,"is_in_doaj":true,"is_core":true,"host_organization":"https://openalex.org/P4324309662","host_organization_name":"Fuji Technology Press Ltd.","host_organization_lineage":["https://openalex.org/P4324309662"],"host_organization_lineage_names":["Fuji Technology Press Ltd."],"type":"journal"},"license":"cc-by-nd","license_id":"https://openalex.org/licenses/cc-by-nd","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Journal of Robotics and Mechatronics","raw_type":"journal-article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":21,"referenced_works":["https://openalex.org/W316935178","https://openalex.org/W2145339207","https://openalex.org/W2159566498","https://openalex.org/W2257979135","https://openalex.org/W2512479688","https://openalex.org/W2583993537","https://openalex.org/W2605102758","https://openalex.org/W2739529772","https://openalex.org/W2740067745","https://openalex.org/W2766447205","https://openalex.org/W2795064979","https://openalex.org/W2885284380","https://openalex.org/W2953303875","https://openalex.org/W2968983352","https://openalex.org/W3100944043","https://openalex.org/W3102777717","https://openalex.org/W3199479418","https://openalex.org/W4367052792","https://openalex.org/W4390044027","https://openalex.org/W4399804862","https://openalex.org/W4403933215"],"related_works":[],"abstract_inverted_index":{"This":[0],"study":[1],"investigates":[2],"the":[3,47,50,73,78,115,125,160,166,173,193],"effect":[4],"of":[5,49,88],"sensor-to-actuation":[6],"delay":[7,101,105,118,140,157],"in":[8,23,35,56,97,147,150,208],"end-to-end":[9],"autonomous":[10],"driving":[11],"using":[12],"deep":[13],"reinforcement":[14],"learning":[15,161],"(DRL).":[16],"Although":[17,179],"DRL-based":[18],"methods":[19],"have":[20],"demonstrated":[21],"success":[22],"tasks":[24],"such":[25,197],"as":[26],"lane":[27],"keeping":[28],"and":[29,104,145,149,165],"obstacle":[30],"avoidance,":[31],"numerous":[32],"challenges":[33],"remain":[34],"real-world":[36,43,209],"applications.":[37],"A":[38],"key":[39],"issue":[40],"is":[41,65],"that":[42,114,137,192],"latency":[44,207],"can":[45],"violate":[46],"assumptions":[48],"Markov":[51],"decision":[52],"process":[53,162],"(MDP),":[54],"resulting":[55],"degraded":[57],"performance.":[58],"To":[59],"address":[60],"this":[61,89],"problem,":[62],"a":[63,131,155,200],"method":[64],"introduced":[66],"wherein":[67],"past":[68,109],"actions":[69],"are":[70],"appended":[71],"to":[72,121,199],"current":[74],"state,":[75],"thereby":[76,203],"preserving":[77],"MDP":[79],"property":[80],"even":[81],"under":[82,183],"delayed":[83],"control":[84],"signals.":[85],"The":[86,111],"efficacy":[87],"approach":[90,194],"was":[91,128,158,169,190],"evaluated":[92],"by":[93,107],"comparing":[94],"three":[95],"scenarios":[96],"simulation:":[98],"no":[99],"delay,":[100],"without":[102,117],"compensation,":[103],"compensation":[106,119],"including":[108],"actions.":[110],"results":[112],"revealed":[113],"scenario":[116],"failed":[120],"learn":[122],"effectively.":[123],"Subsequently,":[124],"trained":[126],"policy":[127],"deployed":[129],"on":[130],"1/10":[132],"scale":[133],"experimental":[134,180],"vehicle,":[135],"demonstrating":[136],"explicitly":[138],"modeling":[139],"significantly":[141],"enhances":[142],"both":[143],"stability":[144],"reliability":[146],"simulation":[148],"physical":[151],"trials.":[152],"Moreover,":[153],"when":[154],"longer":[156],"imposed,":[159],"became":[163],"slower":[164],"action-value":[167],"estimation":[168],"less":[170],"stable,":[171],"yet":[172],"simulated":[174],"vehicle":[175,181],"still":[176],"performed":[177],"successfully.":[178],"tests":[182],"extended":[184],"delays":[185,198],"exhibited":[186],"some":[187],"instability,":[188],"it":[189],"confirmed":[191],"accounted":[195],"for":[196,206],"certain":[201],"extent,":[202],"compensating":[204],"effectively":[205],"environments.":[210]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-19T00:00:00"}