{"id":"https://openalex.org/W4385834370","doi":"https://doi.org/10.1109/tnnls.2023.3300926","title":"Informative Trajectory Planning Using Reinforcement Learning for Minimum-Time Exploration of Spatiotemporal Fields","display_name":"Informative Trajectory Planning Using Reinforcement Learning for Minimum-Time Exploration of Spatiotemporal Fields","publication_year":2023,"publication_date":"2023-08-15","ids":{"openalex":"https://openalex.org/W4385834370","doi":"https://doi.org/10.1109/tnnls.2023.3300926","pmid":"https://pubmed.ncbi.nlm.nih.gov/37581975"},"language":"en","primary_location":{"id":"doi:10.1109/tnnls.2023.3300926","is_oa":false,"landing_page_url":"https://doi.org/10.1109/tnnls.2023.3300926","pdf_url":null,"source":{"id":"https://openalex.org/S4210175523","display_name":"IEEE Transactions on Neural Networks and Learning Systems","issn_l":"2162-237X","issn":["2162-237X","2162-2388"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319808","host_organization_name":"Institute of Electrical and Electronics Engineers","host_organization_lineage":["https://openalex.org/P4310319808"],"host_organization_lineage_names":["Institute of Electrical and Electronics Engineers"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"IEEE Transactions on Neural Networks and Learning Systems","raw_type":"journal-article"},"type":"article","indexed_in":["crossref","pubmed"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5036876831","display_name":"Zhuo Li","orcid":"https://orcid.org/0000-0002-1958-024X"},"institutions":[{"id":"https://openalex.org/I125839683","display_name":"Beijing Institute of Technology","ror":"https://ror.org/01skt4w74","country_code":"CN","type":"education","lineage":["https://openalex.org/I125839683","https://openalex.org/I890469752"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"Zhuo Li","raw_affiliation_strings":["National Key Laboratory of Autonomous Intelligent Unmanned Systems, School of Automation, Beijing Institute of Technology, Beijing, China","School of Automation, National Key Laboratory of Autonomous Intelligent Unmanned Systems, Beijing Institute of Technology, Beijing, China"],"affiliations":[{"raw_affiliation_string":"National Key Laboratory of Autonomous Intelligent Unmanned Systems, School of Automation, Beijing Institute of Technology, Beijing, China","institution_ids":["https://openalex.org/I125839683"]},{"raw_affiliation_string":"School of Automation, National Key Laboratory of Autonomous Intelligent Unmanned Systems, Beijing Institute of Technology, Beijing, China","institution_ids":["https://openalex.org/I125839683"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5088962631","display_name":"Keyou You","orcid":"https://orcid.org/0000-0003-4355-5340"},"institutions":[{"id":"https://openalex.org/I99065089","display_name":"Tsinghua University","ror":"https://ror.org/03cve4549","country_code":"CN","type":"education","lineage":["https://openalex.org/I99065089"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Keyou You","raw_affiliation_strings":["Department of Automation and BNRist, Tsinghua University, Beijing, China"],"affiliations":[{"raw_affiliation_string":"Department of Automation and BNRist, Tsinghua University, Beijing, China","institution_ids":["https://openalex.org/I99065089"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5100701131","display_name":"Jian Sun","orcid":"https://orcid.org/0000-0001-9898-3129"},"institutions":[{"id":"https://openalex.org/I125839683","display_name":"Beijing Institute of Technology","ror":"https://ror.org/01skt4w74","country_code":"CN","type":"education","lineage":["https://openalex.org/I125839683","https://openalex.org/I890469752"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Jian Sun","raw_affiliation_strings":["National Key Laboratory of Autonomous Intelligent Unmanned Systems, School of Automation, Beijing Institute of Technology, Beijing, China","School of Automation, National Key Laboratory of Autonomous Intelligent Unmanned Systems, Beijing Institute of Technology, Beijing, China"],"affiliations":[{"raw_affiliation_string":"National Key Laboratory of Autonomous Intelligent Unmanned Systems, School of Automation, Beijing Institute of Technology, Beijing, China","institution_ids":["https://openalex.org/I125839683"]},{"raw_affiliation_string":"School of Automation, National Key Laboratory of Autonomous Intelligent Unmanned Systems, Beijing Institute of Technology, Beijing, China","institution_ids":["https://openalex.org/I125839683"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5100367403","display_name":"Gang Wang","orcid":"https://orcid.org/0000-0002-7266-2412"},"institutions":[{"id":"https://openalex.org/I125839683","display_name":"Beijing Institute of Technology","ror":"https://ror.org/01skt4w74","country_code":"CN","type":"education","lineage":["https://openalex.org/I125839683","https://openalex.org/I890469752"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Gang Wang","raw_affiliation_strings":["National Key Laboratory of Autonomous Intelligent Unmanned Systems, School of Automation, Beijing Institute of Technology, Beijing, China","School of Automation, National Key Laboratory of Autonomous Intelligent Unmanned Systems, Beijing Institute of Technology, Beijing, China"],"affiliations":[{"raw_affiliation_string":"National Key Laboratory of Autonomous Intelligent Unmanned Systems, School of Automation, Beijing Institute of Technology, Beijing, China","institution_ids":["https://openalex.org/I125839683"]},{"raw_affiliation_string":"School of Automation, National Key Laboratory of Autonomous Intelligent Unmanned Systems, Beijing Institute of Technology, Beijing, China","institution_ids":["https://openalex.org/I125839683"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":["https://openalex.org/A5036876831"],"corresponding_institution_ids":["https://openalex.org/I125839683"],"apc_list":null,"apc_paid":null,"fwci":1.3979,"has_fulltext":false,"cited_by_count":7,"citation_normalized_percentile":{"value":0.82380844,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":94,"max":99},"biblio":{"volume":"35","issue":"12","first_page":"17216","last_page":"17226"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12288","display_name":"Optimization and Search Problems","score":0.9987999796867371,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12288","display_name":"Optimization and Search Problems","score":0.9987999796867371,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10586","display_name":"Robotic Path Planning Algorithms","score":0.9987000226974487,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9968000054359436,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/observability","display_name":"Observability","score":0.8184260129928589},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7442397475242615},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.7338018417358398},{"id":"https://openalex.org/keywords/trajectory","display_name":"Trajectory","score":0.7008180618286133},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.6489227414131165},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.5716290473937988},{"id":"https://openalex.org/keywords/constraint","display_name":"Constraint (computer-aided design)","score":0.5704895257949829},{"id":"https://openalex.org/keywords/motion-planning","display_name":"Motion planning","score":0.5137873291969299},{"id":"https://openalex.org/keywords/field","display_name":"Field (mathematics)","score":0.4696444869041443},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.39807093143463135},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.3359016180038452},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.268377423286438},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.1352531611919403}],"concepts":[{"id":"https://openalex.org/C36299963","wikidata":"https://www.wikidata.org/wiki/Q1369844","display_name":"Observability","level":2,"score":0.8184260129928589},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7442397475242615},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.7338018417358398},{"id":"https://openalex.org/C13662910","wikidata":"https://www.wikidata.org/wiki/Q193139","display_name":"Trajectory","level":2,"score":0.7008180618286133},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6489227414131165},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.5716290473937988},{"id":"https://openalex.org/C2776036281","wikidata":"https://www.wikidata.org/wiki/Q48769818","display_name":"Constraint (computer-aided design)","level":2,"score":0.5704895257949829},{"id":"https://openalex.org/C81074085","wikidata":"https://www.wikidata.org/wiki/Q366872","display_name":"Motion planning","level":3,"score":0.5137873291969299},{"id":"https://openalex.org/C9652623","wikidata":"https://www.wikidata.org/wiki/Q190109","display_name":"Field (mathematics)","level":2,"score":0.4696444869041443},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.39807093143463135},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.3359016180038452},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.268377423286438},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.1352531611919403},{"id":"https://openalex.org/C202444582","wikidata":"https://www.wikidata.org/wiki/Q837863","display_name":"Pure mathematics","level":1,"score":0.0},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.0},{"id":"https://openalex.org/C1276947","wikidata":"https://www.wikidata.org/wiki/Q333","display_name":"Astronomy","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C2524010","wikidata":"https://www.wikidata.org/wiki/Q8087","display_name":"Geometry","level":1,"score":0.0},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.0}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1109/tnnls.2023.3300926","is_oa":false,"landing_page_url":"https://doi.org/10.1109/tnnls.2023.3300926","pdf_url":null,"source":{"id":"https://openalex.org/S4210175523","display_name":"IEEE Transactions on Neural Networks and Learning Systems","issn_l":"2162-237X","issn":["2162-237X","2162-2388"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319808","host_organization_name":"Institute of Electrical and Electronics Engineers","host_organization_lineage":["https://openalex.org/P4310319808"],"host_organization_lineage_names":["Institute of Electrical and Electronics Engineers"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"IEEE Transactions on Neural Networks and Learning Systems","raw_type":"journal-article"},{"id":"pmid:37581975","is_oa":false,"landing_page_url":"https://pubmed.ncbi.nlm.nih.gov/37581975","pdf_url":null,"source":{"id":"https://openalex.org/S4306525036","display_name":"PubMed","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I1299303238","host_organization_name":"National Institutes of Health","host_organization_lineage":["https://openalex.org/I1299303238"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"IEEE transactions on neural networks and learning systems","raw_type":null}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[{"id":"https://openalex.org/G1850434087","display_name":null,"funder_award_id":"62033006","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"},{"id":"https://openalex.org/G2059183635","display_name":null,"funder_award_id":"61925303","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"},{"id":"https://openalex.org/G2575069074","display_name":null,"funder_award_id":"62088101","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"},{"id":"https://openalex.org/G2923177588","display_name":null,"funder_award_id":"62173034","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"},{"id":"https://openalex.org/G7192999862","display_name":null,"funder_award_id":"U20B2073","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"}],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"}],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":36,"referenced_works":["https://openalex.org/W203646022","https://openalex.org/W879905685","https://openalex.org/W1527244075","https://openalex.org/W2019738489","https://openalex.org/W2313274380","https://openalex.org/W2492791808","https://openalex.org/W2752444998","https://openalex.org/W2790049323","https://openalex.org/W2798500587","https://openalex.org/W2943535030","https://openalex.org/W2969096657","https://openalex.org/W3067318617","https://openalex.org/W3088197938","https://openalex.org/W3107627141","https://openalex.org/W3119447081","https://openalex.org/W3163894240","https://openalex.org/W3182751084","https://openalex.org/W3195569952","https://openalex.org/W3202615380","https://openalex.org/W3209083247","https://openalex.org/W4200630212","https://openalex.org/W4200635426","https://openalex.org/W4206602738","https://openalex.org/W4213246061","https://openalex.org/W4214717370","https://openalex.org/W4220741039","https://openalex.org/W4224862297","https://openalex.org/W4225390809","https://openalex.org/W4236076921","https://openalex.org/W4312368000","https://openalex.org/W4321617947","https://openalex.org/W4382932147","https://openalex.org/W6631190155","https://openalex.org/W6747473740","https://openalex.org/W6751961731","https://openalex.org/W6843161954"],"related_works":["https://openalex.org/W3096874164","https://openalex.org/W1985560493","https://openalex.org/W2937181779","https://openalex.org/W2386410636","https://openalex.org/W2357975469","https://openalex.org/W2145363145","https://openalex.org/W1626977535","https://openalex.org/W2341346307","https://openalex.org/W3168977894","https://openalex.org/W2182304831"],"abstract_inverted_index":{"This":[0],"article":[1],"studies":[2],"the":[3,23,46,59,68,72,84,87,114,137,142,152],"informative":[4],"trajectory":[5,77],"planning":[6,110,155],"problem":[7,88],"of":[8,25,35,45,74,159],"an":[9,63,146],"autonomous":[10],"vehicle":[11,47,143],"for":[12,66,97,162],"field":[13,125],"exploration.":[14],"In":[15,54],"contrast":[16],"to":[17,106,130,144],"existing":[18],"works":[19],"concerned":[20],"with":[21,38],"maximizing":[22],"amount":[24],"information":[26,52,64,70],"about":[27],"spatial":[28],"fields,":[29],"this":[30,55],"work":[31],"considers":[32],"efficient":[33,147],"exploration":[34,160],"spatiotemporal":[36,85],"fields":[37],"unknown":[39],"distributions":[40],"and":[41,149],"seeks":[42],"minimum-time":[43,76],"trajectories":[44],"while":[48],"respecting":[49],"a":[50,75,92,99,108,119],"cumulative":[51,69,164],"constraint.":[53],"work,":[56],"upon":[57],"adopting":[58],"observability":[60],"constant":[61],"as":[62,91],"measure":[65],"expressing":[67],"constraint,":[71],"existence":[73],"is":[78,89,104,128],"proven":[79],"under":[80],"mild":[81],"conditions.":[82],"Given":[83],"nature,":[86],"modeled":[90],"Markov":[93],"decision":[94],"process":[95],"(MDP),":[96],"which":[98,127],"reinforcement":[100],"learning":[101],"(RL)":[102],"algorithm":[103],"proposed":[105],"learn":[107],"continuous":[109],"policy.":[111],"To":[112],"accelerate":[113],"policy":[115,139],"learning,":[116],"we":[117],"design":[118],"new":[120],"reward":[121],"function":[122],"by":[123],"leveraging":[124],"approximations,":[126],"demonstrated":[129],"yield":[131],"dense":[132],"rewards.":[133],"Simulations":[134],"show":[135],"that":[136],"learned":[138],"can":[140],"steer":[141],"achieve":[145],"exploration,":[148],"it":[150],"outperforms":[151],"commonly-used":[153],"coverage":[154],"method":[156],"in":[157],"terms":[158],"time":[161],"sufficient":[163],"information.":[165]},"counts_by_year":[{"year":2026,"cited_by_count":1},{"year":2025,"cited_by_count":4},{"year":2024,"cited_by_count":2}],"updated_date":"2026-03-27T05:58:40.876381","created_date":"2025-10-10T00:00:00"}