{"id":"https://openalex.org/W4413925436","doi":"https://doi.org/10.1109/tcds.2025.3605388","title":"Graph Reinforcement Learning-Based Reachability Map for Generalized Mobile Manipulation","display_name":"Graph Reinforcement Learning-Based Reachability Map for Generalized Mobile Manipulation","publication_year":2025,"publication_date":"2025-09-02","ids":{"openalex":"https://openalex.org/W4413925436","doi":"https://doi.org/10.1109/tcds.2025.3605388"},"language":"en","primary_location":{"id":"doi:10.1109/tcds.2025.3605388","is_oa":false,"landing_page_url":"https://doi.org/10.1109/tcds.2025.3605388","pdf_url":null,"source":{"id":"https://openalex.org/S2488537894","display_name":"IEEE Transactions on Cognitive and Developmental Systems","issn_l":"2379-8920","issn":["2379-8920","2379-8939"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319808","host_organization_name":"Institute of Electrical and Electronics Engineers","host_organization_lineage":["https://openalex.org/P4310319808"],"host_organization_lineage_names":["Institute of Electrical and Electronics Engineers"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"IEEE Transactions on Cognitive and Developmental Systems","raw_type":"journal-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":null,"display_name":"Lu Jiang","orcid":"https://orcid.org/0000-0003-0170-0001"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Lu Jiang","raw_affiliation_strings":["College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China"],"raw_orcid":"https://orcid.org/0000-0003-0170-0001","affiliations":[{"raw_affiliation_string":"College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5067832677","display_name":"Junkai Ren","orcid":"https://orcid.org/0009-0008-9011-7267"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Junkai Ren","raw_affiliation_strings":["College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China"],"raw_orcid":"https://orcid.org/0009-0008-9011-7267","affiliations":[{"raw_affiliation_string":"College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5058088662","display_name":"Zhiqian Zhou","orcid":"https://orcid.org/0000-0002-9407-075X"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Zhiqian Zhou","raw_affiliation_strings":["College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China"],"raw_orcid":"https://orcid.org/0000-0002-9407-075X","affiliations":[{"raw_affiliation_string":"College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5027090154","display_name":"Yuke Qu","orcid":"https://orcid.org/0000-0003-0263-8262"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Yuke Qu","raw_affiliation_strings":["College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China"],"raw_orcid":"https://orcid.org/0000-0003-0263-8262","affiliations":[{"raw_affiliation_string":"College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"middle","author":{"id":null,"display_name":"Zhiqiang Zheng","orcid":"https://orcid.org/0000-0003-2656-6689"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Zhiqiang Zheng","raw_affiliation_strings":["College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China"],"raw_orcid":"https://orcid.org/0000-0003-2656-6689","affiliations":[{"raw_affiliation_string":"College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5036075088","display_name":"Huimin Lu","orcid":"https://orcid.org/0000-0002-6375-581X"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Huimin Lu","raw_affiliation_strings":["College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China"],"raw_orcid":"https://orcid.org/0000-0002-6375-581X","affiliations":[{"raw_affiliation_string":"College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5101681550","display_name":"Meiping Wu","orcid":"https://orcid.org/0000-0003-3819-9281"},"institutions":[{"id":"https://openalex.org/I170215575","display_name":"National University of Defense Technology","ror":"https://ror.org/05d2yfz11","country_code":"CN","type":"education","lineage":["https://openalex.org/I170215575"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Meiping Wu","raw_affiliation_strings":["College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China"],"raw_orcid":"https://orcid.org/0000-0003-3819-9281","affiliations":[{"raw_affiliation_string":"College of Intelligence Science and Technology, National University of Defense Technology, Changsha, China","institution_ids":["https://openalex.org/I170215575"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":7,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.24726926,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":"18","issue":"2","first_page":"438","last_page":"451"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10653","display_name":"Robot Manipulation and Learning","score":0.9828000068664551,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10653","display_name":"Robot Manipulation and Learning","score":0.9828000068664551,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9527999758720398,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reachability","display_name":"Reachability","score":0.8775366544723511},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.8556802272796631},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7115299701690674},{"id":"https://openalex.org/keywords/graph","display_name":"Graph","score":0.567180335521698},{"id":"https://openalex.org/keywords/theoretical-computer-science","display_name":"Theoretical computer science","score":0.4840066134929657},{"id":"https://openalex.org/keywords/human\u2013computer-interaction","display_name":"Human\u2013computer interaction","score":0.3966963589191437},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.3862749934196472}],"concepts":[{"id":"https://openalex.org/C136643341","wikidata":"https://www.wikidata.org/wiki/Q1361526","display_name":"Reachability","level":2,"score":0.8775366544723511},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.8556802272796631},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7115299701690674},{"id":"https://openalex.org/C132525143","wikidata":"https://www.wikidata.org/wiki/Q141488","display_name":"Graph","level":2,"score":0.567180335521698},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.4840066134929657},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.3966963589191437},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.3862749934196472}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/tcds.2025.3605388","is_oa":false,"landing_page_url":"https://doi.org/10.1109/tcds.2025.3605388","pdf_url":null,"source":{"id":"https://openalex.org/S2488537894","display_name":"IEEE Transactions on Cognitive and Developmental Systems","issn_l":"2379-8920","issn":["2379-8920","2379-8939"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319808","host_organization_name":"Institute of Electrical and Electronics Engineers","host_organization_lineage":["https://openalex.org/P4310319808"],"host_organization_lineage_names":["Institute of Electrical and Electronics Engineers"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"IEEE Transactions on Cognitive and Developmental Systems","raw_type":"journal-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[{"id":"https://openalex.org/G4269522830","display_name":null,"funder_award_id":"62373201","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"}],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"}],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":["https://openalex.org/W2127267268","https://openalex.org/W2136512912","https://openalex.org/W2067910792","https://openalex.org/W2156446763","https://openalex.org/W2143461633","https://openalex.org/W2150194458","https://openalex.org/W4321471459","https://openalex.org/W2772294324","https://openalex.org/W4253760428","https://openalex.org/W2047831585"],"abstract_inverted_index":{"Mobile":[0],"manipulators":[1],"need":[2],"to":[3,27,61,78],"determine":[4],"feasible":[5],"navigation":[6,24,89],"positions":[7,25],"before":[8],"manipulation":[9],"tasks.":[10],"Real-world":[11],"environments,":[12],"with":[13,120],"varying":[14],"obstacles":[15],"and":[16,102],"objects,":[17],"pose":[18],"significant":[19],"challenges":[20],"for":[21,91],"computing":[22],"optimal":[23],"due":[26],"their":[28],"variability.":[29],"In":[30,136],"this":[31],"work,":[32],"a":[33,56],"novel":[34],"method":[35],"named":[36],"<underline":[37,40,47],"xmlns:mml=\"http://www.w3.org/1998/Math/MathML\"":[38,41,45,48,153],"xmlns:xlink=\"http://www.w3.org/1999/xlink\">G</u>raph":[39],"xmlns:xlink=\"http://www.w3.org/1999/xlink\">R</u>einforcement":[42],"Learning-based":[43],"Re<underline":[44],"xmlns:xlink=\"http://www.w3.org/1999/xlink\">a</u>chability":[46],"xmlns:xlink=\"http://www.w3.org/1999/xlink\">M</u>ap":[49],"(GRAM)":[50],"is":[51,86,149],"proposed.":[52],"First,":[53],"GRAM":[54],"uses":[55],"graph":[57],"attention":[58],"network":[59,77],"(GAT)":[60],"capture":[62],"the":[63,71,74,80,96,108,116,130],"spatial":[64],"relationships":[65],"between":[66],"objects.":[67],"Then,":[68],"it":[69],"leverages":[70],"Q-value":[72],"from":[73],"pre-trained":[75],"critic":[76],"generate":[79],"reachability":[81,84],"map.":[82],"The":[83,113,147],"map":[85],"integrated":[87],"into":[88],"policies":[90],"long-horizon":[92,137],"tasks,":[93,138],"effectively":[94],"solving":[95],"skill":[97],"transition":[98],"problems.":[99],"Extensive":[100],"simulation":[101,121],"real-world":[103],"experiments":[104],"were":[105],"conducted":[106],"on":[107],"Fetch":[109],"mobile":[110],"robot":[111],"platform.":[112],"results":[114,122],"demonstrate":[115],"superiority":[117],"of":[118],"GRAM,":[119],"showing":[123],"an":[124],"average":[125],"16.3%":[126],"performance":[127],"improvement":[128],"over":[129],"baseline":[131],"in":[132],"four":[133],"flexible":[134],"environments.":[135],"GRAM\u2019s":[139],"overall":[140],"task":[141],"success":[142],"rate":[143],"improved":[144],"by":[145],"4.2%.":[146],"project":[148],"open-source":[150],"at":[151],"<uri":[152],"xmlns:xlink=\"http://www.w3.org/1999/xlink\">https://github.com/nubotnudt/Grand":[154],"RM</uri>.":[155]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}