{"id":"https://openalex.org/W2966537656","doi":"https://doi.org/10.24963/ijcai.2019/277","title":"An Actor-Critic-Attention Mechanism for Deep Reinforcement Learning in Multi-view Environments","display_name":"An Actor-Critic-Attention Mechanism for Deep Reinforcement Learning in Multi-view Environments","publication_year":2019,"publication_date":"2019-07-28","ids":{"openalex":"https://openalex.org/W2966537656","doi":"https://doi.org/10.24963/ijcai.2019/277","mag":"2966537656"},"language":"en","primary_location":{"id":"doi:10.24963/ijcai.2019/277","is_oa":true,"landing_page_url":"https://doi.org/10.24963/ijcai.2019/277","pdf_url":"https://www.ijcai.org/proceedings/2019/0277.pdf","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence","raw_type":"proceedings-article"},"type":"conference-paper","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"gold","oa_url":"https://www.ijcai.org/proceedings/2019/0277.pdf","any_repository_has_fulltext":null},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5109431406","display_name":"Elaheh Barati","orcid":null},"institutions":[{"id":"https://openalex.org/I185443292","display_name":"Wayne State University","ror":"https://ror.org/01070mq45","country_code":"US","type":"education","lineage":["https://openalex.org/I185443292"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Elaheh Barati","raw_affiliation_strings":["Department of Computer Science, Wayne State University, Detroit, MI, USA"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Department of Computer Science, Wayne State University, Detroit, MI, USA","institution_ids":["https://openalex.org/I185443292"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5100736157","display_name":"Xuewen Chen","orcid":"https://orcid.org/0000-0002-9058-8332"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Xuewen Chen","raw_affiliation_strings":["AIWAYS AUTO, Shanghai, China"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"AIWAYS AUTO, Shanghai, China","institution_ids":[]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":5,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"2002","last_page":"2008"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9848999977111816,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9848999977111816,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10481","display_name":"Computer Graphics and Visualization Techniques","score":0.9711999893188477,"subfield":{"id":"https://openalex.org/subfields/1704","display_name":"Computer Graphics and Computer-Aided Design"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11574","display_name":"Artificial Intelligence in Games","score":0.9684000015258789,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.9066693782806396},{"id":"https://openalex.org/keywords/observability","display_name":"Observability","score":0.8883234262466431},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.8311651349067688},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.6570894718170166},{"id":"https://openalex.org/keywords/mechanism","display_name":"Mechanism (biology)","score":0.6244786977767944},{"id":"https://openalex.org/keywords/feature","display_name":"Feature (linguistics)","score":0.5633791089057922},{"id":"https://openalex.org/keywords/representation","display_name":"Representation (politics)","score":0.555036723613739},{"id":"https://openalex.org/keywords/process","display_name":"Process (computing)","score":0.5429080128669739},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.4815428853034973},{"id":"https://openalex.org/keywords/feature-learning","display_name":"Feature learning","score":0.4217192828655243},{"id":"https://openalex.org/keywords/human\u2013computer-interaction","display_name":"Human\u2013computer interaction","score":0.32877206802368164}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.9066693782806396},{"id":"https://openalex.org/C36299963","wikidata":"https://www.wikidata.org/wiki/Q1369844","display_name":"Observability","level":2,"score":0.8883234262466431},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.8311651349067688},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6570894718170166},{"id":"https://openalex.org/C89611455","wikidata":"https://www.wikidata.org/wiki/Q6804646","display_name":"Mechanism (biology)","level":2,"score":0.6244786977767944},{"id":"https://openalex.org/C2776401178","wikidata":"https://www.wikidata.org/wiki/Q12050496","display_name":"Feature (linguistics)","level":2,"score":0.5633791089057922},{"id":"https://openalex.org/C2776359362","wikidata":"https://www.wikidata.org/wiki/Q2145286","display_name":"Representation (politics)","level":3,"score":0.555036723613739},{"id":"https://openalex.org/C98045186","wikidata":"https://www.wikidata.org/wiki/Q205663","display_name":"Process (computing)","level":2,"score":0.5429080128669739},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.4815428853034973},{"id":"https://openalex.org/C59404180","wikidata":"https://www.wikidata.org/wiki/Q17013334","display_name":"Feature learning","level":2,"score":0.4217192828655243},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.32877206802368164},{"id":"https://openalex.org/C17744445","wikidata":"https://www.wikidata.org/wiki/Q36442","display_name":"Political science","level":0,"score":0.0},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.0},{"id":"https://openalex.org/C111472728","wikidata":"https://www.wikidata.org/wiki/Q9471","display_name":"Epistemology","level":1,"score":0.0},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.0},{"id":"https://openalex.org/C111919701","wikidata":"https://www.wikidata.org/wiki/Q9135","display_name":"Operating system","level":1,"score":0.0},{"id":"https://openalex.org/C199539241","wikidata":"https://www.wikidata.org/wiki/Q7748","display_name":"Law","level":1,"score":0.0},{"id":"https://openalex.org/C41895202","wikidata":"https://www.wikidata.org/wiki/Q8162","display_name":"Linguistics","level":1,"score":0.0},{"id":"https://openalex.org/C138885662","wikidata":"https://www.wikidata.org/wiki/Q5891","display_name":"Philosophy","level":0,"score":0.0},{"id":"https://openalex.org/C94625758","wikidata":"https://www.wikidata.org/wiki/Q7163","display_name":"Politics","level":2,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.24963/ijcai.2019/277","is_oa":true,"landing_page_url":"https://doi.org/10.24963/ijcai.2019/277","pdf_url":"https://www.ijcai.org/proceedings/2019/0277.pdf","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence","raw_type":"proceedings-article"}],"best_oa_location":{"id":"doi:10.24963/ijcai.2019/277","is_oa":true,"landing_page_url":"https://doi.org/10.24963/ijcai.2019/277","pdf_url":"https://www.ijcai.org/proceedings/2019/0277.pdf","source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence","raw_type":"proceedings-article"},"sustainable_development_goals":[{"score":0.6000000238418579,"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16"}],"awards":[],"funders":[],"has_content":{"pdf":true,"grobid_xml":true},"content_urls":{"pdf":"https://content.openalex.org/works/W2966537656.pdf","grobid_xml":"https://content.openalex.org/works/W2966537656.grobid-xml"},"referenced_works_count":23,"referenced_works":["https://openalex.org/W1522301498","https://openalex.org/W1560074431","https://openalex.org/W2043806097","https://openalex.org/W2133564696","https://openalex.org/W2145339207","https://openalex.org/W2158782408","https://openalex.org/W2271840356","https://openalex.org/W2726187156","https://openalex.org/W2727840223","https://openalex.org/W2734878594","https://openalex.org/W2736601468","https://openalex.org/W2756196406","https://openalex.org/W2781585732","https://openalex.org/W2786928559","https://openalex.org/W2798705390","https://openalex.org/W2908261578","https://openalex.org/W2944616579","https://openalex.org/W2951896791","https://openalex.org/W2963864421","https://openalex.org/W2964043796","https://openalex.org/W4297810554","https://openalex.org/W4299802797","https://openalex.org/W4302570325"],"related_works":["https://openalex.org/W2046459260","https://openalex.org/W2967463586","https://openalex.org/W2765830098","https://openalex.org/W1971989957","https://openalex.org/W2517338020","https://openalex.org/W2905271011","https://openalex.org/W3164948662","https://openalex.org/W4289536128","https://openalex.org/W3153597579","https://openalex.org/W1872833176"],"abstract_inverted_index":{"In":[0,17,40],"reinforcement":[1,47],"learning":[2,13,48],"algorithms,":[3],"leveraging":[4],"multiple":[5,83],"views":[6,26],"of":[7,14,35,79,136],"the":[8,12,22,25,66,100,134],"environment":[9,80],"can":[10,60],"improve":[11],"complicated":[15],"policies.":[16],"multi-view":[18,56],"environments,":[19],"due":[20],"to":[21,89,92,132],"fact":[23],"that":[24,107],"may":[27],"frequently":[28],"suffer":[29],"from":[30],"partial":[31,143],"observability,":[32],"their":[33],"level":[34],"importance":[36,98],"are":[37],"often":[38],"different.":[39],"this":[41],"paper,":[42],"we":[43,105],"propose":[44],"a":[45,55,75,87],"deep":[46],"method":[49,73,109,138],"and":[50,119,142],"an":[51],"attention":[52,70],"mechanism":[53],"in":[54,99],"environment.":[57,67],"Each":[58],"view":[59,94],"provide":[61,129],"various":[62],"representative":[63],"information":[64],"about":[65],"Through":[68,103],"our":[69,72,108,137],"mechanism,":[71],"generates":[74],"single":[76],"feature":[77],"representation":[78],"given":[81],"its":[82,97,111],"views.":[84],"It":[85],"learns":[86],"policy":[88],"dynamically":[90],"attend":[91],"each":[93],"based":[95],"on":[96,114,139],"decision-making":[101],"process.":[102],"experiments,":[104],"show":[106],"outperforms":[110],"state-of-the-art":[112],"baselines":[113],"TORCS":[115],"racing":[116],"car":[117],"simulator":[118],"three":[120],"other":[121],"complex":[122],"3D":[123],"environments":[124],"with":[125],"obstacles.":[126],"We":[127],"also":[128],"experimental":[130],"results":[131],"evaluate":[133],"performance":[135],"noisy":[140],"conditions":[141],"observation":[144],"settings.":[145]},"counts_by_year":[{"year":2025,"cited_by_count":1},{"year":2023,"cited_by_count":1},{"year":2022,"cited_by_count":1},{"year":2021,"cited_by_count":1},{"year":2020,"cited_by_count":1}],"updated_date":"2026-07-14T23:27:15.235271","created_date":"2025-10-10T00:00:00"}