{"id":"https://openalex.org/W4289656839","doi":"https://doi.org/10.1007/978-3-031-13822-5_8","title":"Multi-robot Cooperation Learning Based on\u00a0Powell Deep Deterministic Policy Gradient","display_name":"Multi-robot Cooperation Learning Based on\u00a0Powell Deep Deterministic Policy Gradient","publication_year":2022,"publication_date":"2022-01-01","ids":{"openalex":"https://openalex.org/W4289656839","doi":"https://doi.org/10.1007/978-3-031-13822-5_8"},"language":"en","primary_location":{"id":"doi:10.1007/978-3-031-13822-5_8","is_oa":false,"landing_page_url":"https://doi.org/10.1007/978-3-031-13822-5_8","pdf_url":null,"source":{"id":"https://openalex.org/S106296714","display_name":"Lecture notes in computer science","issn_l":"0302-9743","issn":["0302-9743","1611-3349"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319900","host_organization_name":"Springer Science+Business Media","host_organization_lineage":["https://openalex.org/P4310319900","https://openalex.org/P4310319965"],"host_organization_lineage_names":["Springer Science+Business Media","Springer Nature"],"type":"book series"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Lecture Notes in Computer Science","raw_type":"book-chapter"},"type":"book-chapter","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5032289171","display_name":"Zongyuan Li","orcid":null},"institutions":[{"id":"https://openalex.org/I205237279","display_name":"Nankai University","ror":"https://ror.org/01y1kjr75","country_code":"CN","type":"education","lineage":["https://openalex.org/I205237279"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"Zongyuan Li","raw_affiliation_strings":["College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China"],"affiliations":[{"raw_affiliation_string":"College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China","institution_ids":["https://openalex.org/I205237279"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5046878165","display_name":"Chuxi Xiao","orcid":null},"institutions":[{"id":"https://openalex.org/I205237279","display_name":"Nankai University","ror":"https://ror.org/01y1kjr75","country_code":"CN","type":"education","lineage":["https://openalex.org/I205237279"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Chuxi Xiao","raw_affiliation_strings":["College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China"],"affiliations":[{"raw_affiliation_string":"College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China","institution_ids":["https://openalex.org/I205237279"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5100383203","display_name":"Ziyi Liu","orcid":"https://orcid.org/0000-0002-2407-9599"},"institutions":[{"id":"https://openalex.org/I205237279","display_name":"Nankai University","ror":"https://ror.org/01y1kjr75","country_code":"CN","type":"education","lineage":["https://openalex.org/I205237279"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Ziyi Liu","raw_affiliation_strings":["College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China"],"affiliations":[{"raw_affiliation_string":"College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China","institution_ids":["https://openalex.org/I205237279"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5011228578","display_name":"Xian Guo","orcid":"https://orcid.org/0000-0003-2390-4777"},"institutions":[{"id":"https://openalex.org/I205237279","display_name":"Nankai University","ror":"https://ror.org/01y1kjr75","country_code":"CN","type":"education","lineage":["https://openalex.org/I205237279"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Xian Guo","raw_affiliation_strings":["College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China"],"affiliations":[{"raw_affiliation_string":"College of Artificial Intelligence, Nankai University, China Institute of Robotics and Automatic Information System, Tianjin, China","institution_ids":["https://openalex.org/I205237279"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":["https://openalex.org/A5032289171"],"corresponding_institution_ids":["https://openalex.org/I205237279"],"apc_list":{"value":5000,"currency":"EUR","value_usd":5392},"apc_paid":null,"fwci":0.3429,"has_fulltext":false,"cited_by_count":1,"citation_normalized_percentile":{"value":0.59108471,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":94},"biblio":{"volume":null,"issue":null,"first_page":"77","last_page":"87"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.9976999759674072,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10603","display_name":"Smart Grid Energy Management","score":0.9860000014305115,"subfield":{"id":"https://openalex.org/subfields/2208","display_name":"Electrical and Electronic Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.8710039258003235},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.8158433437347412},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.6700541973114014},{"id":"https://openalex.org/keywords/range","display_name":"Range (aeronautics)","score":0.6064804792404175},{"id":"https://openalex.org/keywords/process","display_name":"Process (computing)","score":0.5173784494400024},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.5136579871177673},{"id":"https://openalex.org/keywords/variable","display_name":"Variable (mathematics)","score":0.49209851026535034},{"id":"https://openalex.org/keywords/deep-learning","display_name":"Deep learning","score":0.4830487370491028},{"id":"https://openalex.org/keywords/conjugate-gradient-method","display_name":"Conjugate gradient method","score":0.47431182861328125},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.4611855149269104},{"id":"https://openalex.org/keywords/gradient-method","display_name":"Gradient method","score":0.45376694202423096},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.4402173161506653},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.3572709560394287},{"id":"https://openalex.org/keywords/algorithm","display_name":"Algorithm","score":0.22794562578201294},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.09832906723022461}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.8710039258003235},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.8158433437347412},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6700541973114014},{"id":"https://openalex.org/C204323151","wikidata":"https://www.wikidata.org/wiki/Q905424","display_name":"Range (aeronautics)","level":2,"score":0.6064804792404175},{"id":"https://openalex.org/C98045186","wikidata":"https://www.wikidata.org/wiki/Q205663","display_name":"Process (computing)","level":2,"score":0.5173784494400024},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.5136579871177673},{"id":"https://openalex.org/C182365436","wikidata":"https://www.wikidata.org/wiki/Q50701","display_name":"Variable (mathematics)","level":2,"score":0.49209851026535034},{"id":"https://openalex.org/C108583219","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep learning","level":2,"score":0.4830487370491028},{"id":"https://openalex.org/C81184566","wikidata":"https://www.wikidata.org/wiki/Q1191895","display_name":"Conjugate gradient method","level":2,"score":0.47431182861328125},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.4611855149269104},{"id":"https://openalex.org/C115680565","wikidata":"https://www.wikidata.org/wiki/Q5977448","display_name":"Gradient method","level":2,"score":0.45376694202423096},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.4402173161506653},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3572709560394287},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.22794562578201294},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.09832906723022461},{"id":"https://openalex.org/C111919701","wikidata":"https://www.wikidata.org/wiki/Q9135","display_name":"Operating system","level":1,"score":0.0},{"id":"https://openalex.org/C192562407","wikidata":"https://www.wikidata.org/wiki/Q228736","display_name":"Materials science","level":0,"score":0.0},{"id":"https://openalex.org/C134306372","wikidata":"https://www.wikidata.org/wiki/Q7754","display_name":"Mathematical analysis","level":1,"score":0.0},{"id":"https://openalex.org/C159985019","wikidata":"https://www.wikidata.org/wiki/Q181790","display_name":"Composite material","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1007/978-3-031-13822-5_8","is_oa":false,"landing_page_url":"https://doi.org/10.1007/978-3-031-13822-5_8","pdf_url":null,"source":{"id":"https://openalex.org/S106296714","display_name":"Lecture notes in computer science","issn_l":"0302-9743","issn":["0302-9743","1611-3349"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319900","host_organization_name":"Springer Science+Business Media","host_organization_lineage":["https://openalex.org/P4310319900","https://openalex.org/P4310319965"],"host_organization_lineage_names":["Springer Science+Business Media","Springer Nature"],"type":"book series"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Lecture Notes in Computer Science","raw_type":"book-chapter"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":2,"referenced_works":["https://openalex.org/W2617547828","https://openalex.org/W2746553466"],"related_works":["https://openalex.org/W2604655597","https://openalex.org/W2360314603","https://openalex.org/W3082608044","https://openalex.org/W2846499288","https://openalex.org/W4229957265","https://openalex.org/W2357791884","https://openalex.org/W2393400400","https://openalex.org/W4291138102","https://openalex.org/W2377683511","https://openalex.org/W3131790919"],"abstract_inverted_index":null,"counts_by_year":[{"year":2023,"cited_by_count":1}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}