{"id":"https://openalex.org/W4302774882","doi":"https://doi.org/10.23919/sice56594.2022.9905819","title":"Efficiency of Reinforcement Learning using Polarized Regime by Variational Autoencoder","display_name":"Efficiency of Reinforcement Learning using Polarized Regime by Variational Autoencoder","publication_year":2022,"publication_date":"2022-09-06","ids":{"openalex":"https://openalex.org/W4302774882","doi":"https://doi.org/10.23919/sice56594.2022.9905819"},"language":"en","primary_location":{"id":"doi:10.23919/sice56594.2022.9905819","is_oa":false,"landing_page_url":"https://doi.org/10.23919/sice56594.2022.9905819","pdf_url":null,"source":{"id":"https://openalex.org/S4363608498","display_name":"2022 61st Annual Conference of the Society of Instrument and Control Engineers (SICE)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2022 61st Annual Conference of the Society of Instrument and Control Engineers (SICE)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5110172483","display_name":"Nakai Masato","orcid":null},"institutions":[{"id":"https://openalex.org/I146399215","display_name":"University of Tsukuba","ror":"https://ror.org/02956yf07","country_code":"JP","type":"education","lineage":["https://openalex.org/I146399215"]}],"countries":["JP"],"is_corresponding":true,"raw_author_name":"Masato Nakai","raw_affiliation_strings":["University of Tsukuba,Doctoral Program in Intelligent and Mechanical Interaction Systems,Japan","Doctoral Program in Intelligent and Mechanical Interaction Systems, University of Tsukuba, Japan"],"affiliations":[{"raw_affiliation_string":"University of Tsukuba,Doctoral Program in Intelligent and Mechanical Interaction Systems,Japan","institution_ids":["https://openalex.org/I146399215"]},{"raw_affiliation_string":"Doctoral Program in Intelligent and Mechanical Interaction Systems, University of Tsukuba, Japan","institution_ids":["https://openalex.org/I146399215"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5101693065","display_name":"Takeshi Shibuya","orcid":"https://orcid.org/0000-0003-4645-5898"},"institutions":[{"id":"https://openalex.org/I146399215","display_name":"University of Tsukuba","ror":"https://ror.org/02956yf07","country_code":"JP","type":"education","lineage":["https://openalex.org/I146399215"]}],"countries":["JP"],"is_corresponding":false,"raw_author_name":"Takeshi Shibuya","raw_affiliation_strings":["University of Tsukuba,Faculty of Engineering, Information and System,Japan","Faculty of Engineering, Information and System, University of Tsukuba, Japan"],"affiliations":[{"raw_affiliation_string":"University of Tsukuba,Faculty of Engineering, Information and System,Japan","institution_ids":["https://openalex.org/I146399215"]},{"raw_affiliation_string":"Faculty of Engineering, Information and System, University of Tsukuba, Japan","institution_ids":["https://openalex.org/I146399215"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":["https://openalex.org/A5110172483"],"corresponding_institution_ids":["https://openalex.org/I146399215"],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.10870502,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"128","last_page":"134"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12611","display_name":"Neural Networks and Reservoir Computing","score":0.9937999844551086,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12611","display_name":"Neural Networks and Reservoir Computing","score":0.9937999844551086,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10581","display_name":"Neural dynamics and brain function","score":0.9811000227928162,"subfield":{"id":"https://openalex.org/subfields/2805","display_name":"Cognitive Neuroscience"},"field":{"id":"https://openalex.org/fields/28","display_name":"Neuroscience"},"domain":{"id":"https://openalex.org/domains/1","display_name":"Life Sciences"}},{"id":"https://openalex.org/T11206","display_name":"Model Reduction and Neural Networks","score":0.9800999760627747,"subfield":{"id":"https://openalex.org/subfields/3109","display_name":"Statistical and Nonlinear Physics"},"field":{"id":"https://openalex.org/fields/31","display_name":"Physics and Astronomy"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.9401897192001343},{"id":"https://openalex.org/keywords/autoencoder","display_name":"Autoencoder","score":0.939213216304779},{"id":"https://openalex.org/keywords/reinforcement","display_name":"Reinforcement","score":0.7305604219436646},{"id":"https://openalex.org/keywords/latent-variable","display_name":"Latent variable","score":0.6653686761856079},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.638930082321167},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.5884963274002075},{"id":"https://openalex.org/keywords/unsupervised-learning","display_name":"Unsupervised learning","score":0.4384151101112366},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.39809107780456543},{"id":"https://openalex.org/keywords/pattern-recognition","display_name":"Pattern recognition (psychology)","score":0.3397512435913086},{"id":"https://openalex.org/keywords/deep-learning","display_name":"Deep learning","score":0.29632148146629333},{"id":"https://openalex.org/keywords/engineering","display_name":"Engineering","score":0.11516442894935608},{"id":"https://openalex.org/keywords/structural-engineering","display_name":"Structural engineering","score":0.08672440052032471}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.9401897192001343},{"id":"https://openalex.org/C101738243","wikidata":"https://www.wikidata.org/wiki/Q786435","display_name":"Autoencoder","level":3,"score":0.939213216304779},{"id":"https://openalex.org/C67203356","wikidata":"https://www.wikidata.org/wiki/Q1321905","display_name":"Reinforcement","level":2,"score":0.7305604219436646},{"id":"https://openalex.org/C51167844","wikidata":"https://www.wikidata.org/wiki/Q4422623","display_name":"Latent variable","level":2,"score":0.6653686761856079},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.638930082321167},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5884963274002075},{"id":"https://openalex.org/C8038995","wikidata":"https://www.wikidata.org/wiki/Q1152135","display_name":"Unsupervised learning","level":2,"score":0.4384151101112366},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.39809107780456543},{"id":"https://openalex.org/C153180895","wikidata":"https://www.wikidata.org/wiki/Q7148389","display_name":"Pattern recognition (psychology)","level":2,"score":0.3397512435913086},{"id":"https://openalex.org/C108583219","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep learning","level":2,"score":0.29632148146629333},{"id":"https://openalex.org/C127413603","wikidata":"https://www.wikidata.org/wiki/Q11023","display_name":"Engineering","level":0,"score":0.11516442894935608},{"id":"https://openalex.org/C66938386","wikidata":"https://www.wikidata.org/wiki/Q633538","display_name":"Structural engineering","level":1,"score":0.08672440052032471}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.23919/sice56594.2022.9905819","is_oa":false,"landing_page_url":"https://doi.org/10.23919/sice56594.2022.9905819","pdf_url":null,"source":{"id":"https://openalex.org/S4363608498","display_name":"2022 61st Annual Conference of the Society of Instrument and Control Engineers (SICE)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2022 61st Annual Conference of the Society of Instrument and Control Engineers (SICE)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"display_name":"Sustainable cities and communities","score":0.4699999988079071,"id":"https://metadata.un.org/sdg/11"}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":17,"referenced_works":["https://openalex.org/W7934506","https://openalex.org/W1605438009","https://openalex.org/W2009086942","https://openalex.org/W2787666871","https://openalex.org/W2920362155","https://openalex.org/W2963226019","https://openalex.org/W2977481643","https://openalex.org/W3171769810","https://openalex.org/W4289294484","https://openalex.org/W4298857966","https://openalex.org/W6637967152","https://openalex.org/W6718140377","https://openalex.org/W6750253780","https://openalex.org/W6756256016","https://openalex.org/W6760405395","https://openalex.org/W6768511085","https://openalex.org/W6790224726"],"related_works":["https://openalex.org/W3013693939","https://openalex.org/W2159052453","https://openalex.org/W2566616303","https://openalex.org/W3131327266","https://openalex.org/W2988134182","https://openalex.org/W2806873178","https://openalex.org/W2965146396","https://openalex.org/W3203657119","https://openalex.org/W4312416532","https://openalex.org/W2770818364"],"abstract_inverted_index":{"Reinforcement":[0],"learning":[1,15,35,75,96,154],"from":[2,9,17],"low-dimensional":[3,32],"state":[4],"expressions":[5],"extracted":[6],"as":[7],"features":[8],"images":[10],"is":[11,23,49],"more":[12],"efficient":[13],"than":[14],"directly":[16],"high-dimensional":[18],"images.":[19],"The":[20,118],"autoencoder":[21,42],"(AE)":[22],"typically":[24],"used":[25],"to":[26,51,69,90,112,152],"render":[27],"an":[28,98],"image":[29,113],"into":[30],"a":[31,53,77,86],"state;":[33],"reinforcement":[34,74,95,116,153],"on":[36],"latent":[37,61,109,148],"variables":[38,110,149],"encoded":[39],"by":[40,131],"variational":[41],"(VAE)":[43],"give":[44],"excellent":[45],"results.":[46],"Notably,":[47],"VAE":[48,87],"known":[50],"have":[52,67],"polarized":[54,78,88,108,157],"regime":[55,89],"and":[56,115],"disentanglement":[57],"among":[58],"the":[59,71,83,92,133,143,147,156],"generated":[60],"variables.":[62],"However":[63],"very":[64],"few":[65],"studies":[66],"attempted":[68],"improve":[70,91],"efficiency":[72,93],"of":[73,85,94,135,138,145],"using":[76,97,155],"regime.":[79,158],"This":[80],"paper":[81],"demonstrates":[82],"capability":[84],"interactive":[99],"driving":[100],"game.":[101],"It":[102],"was":[103],"found":[104],"that":[105,121,150],"only":[106,146],"some":[107],"contribute":[111,151],"restoration":[114],"learning.":[117],"results":[119],"show":[120],"calculation":[122],"times":[123],"can":[124],"be":[125],"significantly":[126],"shortened":[127],"while":[128],"maintaining":[129],"performance":[130],"reducing":[132],"number":[134],"search":[136],"points":[137],"ES":[139],"(Evolution":[140],"Strategy)":[141],"via":[142],"selection":[144]},"counts_by_year":[],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}