{"id":"https://openalex.org/W3204490324","doi":"https://doi.org/10.1109/case49439.2021.9551596","title":"Reinforcement Learning-based Learning from Demonstrations for Collaborative Robots","display_name":"Reinforcement Learning-based Learning from Demonstrations for Collaborative Robots","publication_year":2021,"publication_date":"2021-08-23","ids":{"openalex":"https://openalex.org/W3204490324","doi":"https://doi.org/10.1109/case49439.2021.9551596","mag":"3204490324"},"language":"en","primary_location":{"id":"doi:10.1109/case49439.2021.9551596","is_oa":false,"landing_page_url":"https://doi.org/10.1109/case49439.2021.9551596","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2021 IEEE 17th International Conference on Automation Science and Engineering (CASE)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5015479024","display_name":"W.D. Li","orcid":null},"institutions":[{"id":"https://openalex.org/I196699116","display_name":"Wuhan University of Technology","ror":"https://ror.org/03fe7t173","country_code":"CN","type":"education","lineage":["https://openalex.org/I196699116"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"W.D. Li","raw_affiliation_strings":["School of Logistics Engineering, Wuhan University of Technology, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"School of Logistics Engineering, Wuhan University of Technology, China","institution_ids":["https://openalex.org/I196699116"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":["https://openalex.org/A5015479024"],"corresponding_institution_ids":["https://openalex.org/I196699116"],"apc_list":null,"apc_paid":null,"fwci":0.1388,"has_fulltext":false,"cited_by_count":2,"citation_normalized_percentile":{"value":0.46210311,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":90,"max":95},"biblio":{"volume":null,"issue":null,"first_page":"1642","last_page":"1647"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10653","display_name":"Robot Manipulation and Learning","score":0.9958000183105469,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10653","display_name":"Robot Manipulation and Learning","score":0.9958000183105469,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12784","display_name":"Modular Robots and Swarm Intelligence","score":0.9952999949455261,"subfield":{"id":"https://openalex.org/subfields/2210","display_name":"Mechanical Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10586","display_name":"Robotic Path Planning Algorithms","score":0.9837999939918518,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/mixture-model","display_name":"Mixture model","score":0.7327224016189575},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.730255126953125},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7098585367202759},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.6444952487945557},{"id":"https://openalex.org/keywords/robot","display_name":"Robot","score":0.5802974700927734},{"id":"https://openalex.org/keywords/noise","display_name":"Noise (video)","score":0.5276737809181213},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.5224379897117615},{"id":"https://openalex.org/keywords/gaussian-process","display_name":"Gaussian process","score":0.4508955478668213},{"id":"https://openalex.org/keywords/gaussian","display_name":"Gaussian","score":0.4303191900253296},{"id":"https://openalex.org/keywords/pattern-recognition","display_name":"Pattern recognition (psychology)","score":0.3275693655014038},{"id":"https://openalex.org/keywords/image","display_name":"Image (mathematics)","score":0.06694036722183228}],"concepts":[{"id":"https://openalex.org/C61224824","wikidata":"https://www.wikidata.org/wiki/Q2260434","display_name":"Mixture model","level":2,"score":0.7327224016189575},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.730255126953125},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7098585367202759},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6444952487945557},{"id":"https://openalex.org/C90509273","wikidata":"https://www.wikidata.org/wiki/Q11012","display_name":"Robot","level":2,"score":0.5802974700927734},{"id":"https://openalex.org/C99498987","wikidata":"https://www.wikidata.org/wiki/Q2210247","display_name":"Noise (video)","level":3,"score":0.5276737809181213},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.5224379897117615},{"id":"https://openalex.org/C61326573","wikidata":"https://www.wikidata.org/wiki/Q1496376","display_name":"Gaussian process","level":3,"score":0.4508955478668213},{"id":"https://openalex.org/C163716315","wikidata":"https://www.wikidata.org/wiki/Q901177","display_name":"Gaussian","level":2,"score":0.4303191900253296},{"id":"https://openalex.org/C153180895","wikidata":"https://www.wikidata.org/wiki/Q7148389","display_name":"Pattern recognition (psychology)","level":2,"score":0.3275693655014038},{"id":"https://openalex.org/C115961682","wikidata":"https://www.wikidata.org/wiki/Q860623","display_name":"Image (mathematics)","level":2,"score":0.06694036722183228},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/case49439.2021.9551596","is_oa":false,"landing_page_url":"https://doi.org/10.1109/case49439.2021.9551596","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2021 IEEE 17th International Conference on Automation Science and Engineering (CASE)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/9","display_name":"Industry, innovation and infrastructure","score":0.5299999713897705}],"awards":[{"id":"https://openalex.org/G1838805474","display_name":null,"funder_award_id":"51975444","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"}],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"}],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":13,"referenced_works":["https://openalex.org/W1995515218","https://openalex.org/W2091970056","https://openalex.org/W2312797433","https://openalex.org/W2561340204","https://openalex.org/W2569211358","https://openalex.org/W2765795464","https://openalex.org/W2768174095","https://openalex.org/W2795577874","https://openalex.org/W2887891324","https://openalex.org/W2888620614","https://openalex.org/W2906613229","https://openalex.org/W2945586772","https://openalex.org/W3112738263"],"related_works":["https://openalex.org/W4306904969","https://openalex.org/W2138720691","https://openalex.org/W4362501864","https://openalex.org/W4380318855","https://openalex.org/W2031695474","https://openalex.org/W1578916557","https://openalex.org/W1992295166","https://openalex.org/W1964286703","https://openalex.org/W2143508933","https://openalex.org/W2169866437"],"abstract_inverted_index":{"Learning":[0,69],"from":[1],"Demonstrations":[2],"(LfD)":[3],"can":[4],"support":[5,108],"a":[6,11,35,42,79,92],"human":[7],"operator":[8],"to":[9,54,76,98,106,121,131],"control":[10],"collaborative":[12],"robot":[13],"(cobot)":[14],"in":[15,56,63,148],"an":[16,66,114],"intuitive":[17],"means.":[18],"Gaussian":[19,23,93],"Mixture":[20,24],"Model":[21],"and":[22,27,48,103,137,151],"Regression":[25],"(GMM":[26],"GMR)":[28],"are":[29,89],"useful":[30],"tools":[31],"for":[32,72],"implementing":[33],"such":[34],"LfD":[36],"approach.":[37,134],"However,":[38],"well-performed":[39],"GMM/GMR":[40,73],"require":[41],"series":[43],"of":[44,81,86,111],"demonstrations":[45,100],"without":[46],"trembling":[47,102],"jerky":[49,104],"features,":[50],"which":[51],"is":[52,74,96,119],"challenging":[53],"achieve":[55],"practical":[57],"applications.":[58],"To":[59],"address":[60],"this":[61,64,142],"issue,":[62],"paper,":[65],"improved":[67,115],"Reinforcement":[68],"(RL)-based":[70],"approach":[71,144],"devised":[75],"carry":[77],"out":[78],"variety":[80],"complex":[82],"tasks.":[83],"The":[84],"innovations":[85],"the":[87,109,133],"research":[88],"twofold:":[90],"firstly,":[91],"noise":[94],"strategy":[95],"designed":[97],"scatter":[99],"with":[101],"features":[105],"better":[107],"optimization":[110,117],"GMM/GMR;":[112],"Secondly,":[113],"RL-based":[116],"algorithm":[118],"developed":[120,143],"eliminate":[122],"potential":[123],"under-lover-fitting":[124],"GMM/GMR.":[125],"A":[126],"cases":[127],"study":[128],"was":[129],"conducted":[130],"verify":[132],"Experimental":[135],"results":[136],"comparative":[138],"analyses":[139],"showed":[140],"that":[141],"exhibited":[145],"good":[146],"performances":[147],"computational":[149],"efficiency":[150],"solution":[152],"quality.":[153]},"counts_by_year":[{"year":2025,"cited_by_count":1},{"year":2022,"cited_by_count":1}],"updated_date":"2026-05-20T08:49:12.498775","created_date":"2025-10-10T00:00:00"}