{"id":"https://openalex.org/W4385816177","doi":"https://doi.org/10.1145/3592307.3592314","title":"Graph Structure Exploration for Reinforcement Learning State Embedding \u2013 Train Tetris Agent with Graph Neural Network","display_name":"Graph Structure Exploration for Reinforcement Learning State Embedding \u2013 Train Tetris Agent with Graph Neural Network","publication_year":2023,"publication_date":"2023-03-24","ids":{"openalex":"https://openalex.org/W4385816177","doi":"https://doi.org/10.1145/3592307.3592314"},"language":"en","primary_location":{"id":"doi:10.1145/3592307.3592314","is_oa":false,"landing_page_url":"https://doi.org/10.1145/3592307.3592314","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 2023 6th International Conference on Electronics, Communications and Control Engineering","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5070435404","display_name":"Weijie Guan","orcid":"https://orcid.org/0000-0003-4001-7862"},"institutions":[{"id":"https://openalex.org/I12912129","display_name":"Northeastern University","ror":"https://ror.org/04t5xt781","country_code":"US","type":"education","lineage":["https://openalex.org/I12912129"]}],"countries":["US"],"is_corresponding":true,"raw_author_name":"Weijie Guan","raw_affiliation_strings":["Northeastern University, USA"],"raw_orcid":"https://orcid.org/0000-0003-4001-7862","affiliations":[{"raw_affiliation_string":"Northeastern University, USA","institution_ids":["https://openalex.org/I12912129"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5016873765","display_name":"Zhufeng Li","orcid":"https://orcid.org/0000-0001-9124-8383"},"institutions":[{"id":"https://openalex.org/I100722782","display_name":"Fukuoka Institute of Technology","ror":"https://ror.org/00bmxak18","country_code":"JP","type":"education","lineage":["https://openalex.org/I100722782"]}],"countries":["JP"],"is_corresponding":false,"raw_author_name":"Zhufeng Li","raw_affiliation_strings":["Fukuoka Institute of Technology, Japan"],"raw_orcid":"https://orcid.org/0000-0001-9124-8383","affiliations":[{"raw_affiliation_string":"Fukuoka Institute of Technology, Japan","institution_ids":["https://openalex.org/I100722782"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5043110110","display_name":"H. Yamauchi","orcid":"https://orcid.org/0000-0003-4033-8893"},"institutions":[{"id":"https://openalex.org/I100722782","display_name":"Fukuoka Institute of Technology","ror":"https://ror.org/00bmxak18","country_code":"JP","type":"education","lineage":["https://openalex.org/I100722782"]}],"countries":["JP"],"is_corresponding":false,"raw_author_name":"Hiroyuki Yamauchi","raw_affiliation_strings":["Fukuoka Institute of Technology, Japan"],"raw_orcid":"https://orcid.org/0000-0003-4033-8893","affiliations":[{"raw_affiliation_string":"Fukuoka Institute of Technology, Japan","institution_ids":["https://openalex.org/I100722782"]}]}],"institutions":[],"countries_distinct_count":2,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5070435404"],"corresponding_institution_ids":["https://openalex.org/I12912129"],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.0957167,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"42","last_page":"48"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11273","display_name":"Advanced Graph Neural Networks","score":0.9976999759674072,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11273","display_name":"Advanced Graph Neural Networks","score":0.9976999759674072,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10270","display_name":"Blockchain Technology Applications and Security","score":0.979200005531311,"subfield":{"id":"https://openalex.org/subfields/1710","display_name":"Information Systems"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12761","display_name":"Data Stream Mining Techniques","score":0.9681000113487244,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.8645172715187073},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7499995231628418},{"id":"https://openalex.org/keywords/graph","display_name":"Graph","score":0.5601629018783569},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.5563649535179138},{"id":"https://openalex.org/keywords/theoretical-computer-science","display_name":"Theoretical computer science","score":0.4771955907344818},{"id":"https://openalex.org/keywords/encode","display_name":"ENCODE","score":0.4148979187011719},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.3205069899559021}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.8645172715187073},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7499995231628418},{"id":"https://openalex.org/C132525143","wikidata":"https://www.wikidata.org/wiki/Q141488","display_name":"Graph","level":2,"score":0.5601629018783569},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5563649535179138},{"id":"https://openalex.org/C80444323","wikidata":"https://www.wikidata.org/wiki/Q2878974","display_name":"Theoretical computer science","level":1,"score":0.4771955907344818},{"id":"https://openalex.org/C66746571","wikidata":"https://www.wikidata.org/wiki/Q1134833","display_name":"ENCODE","level":3,"score":0.4148979187011719},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3205069899559021},{"id":"https://openalex.org/C104317684","wikidata":"https://www.wikidata.org/wiki/Q7187","display_name":"Gene","level":2,"score":0.0},{"id":"https://openalex.org/C185592680","wikidata":"https://www.wikidata.org/wiki/Q2329","display_name":"Chemistry","level":0,"score":0.0},{"id":"https://openalex.org/C55493867","wikidata":"https://www.wikidata.org/wiki/Q7094","display_name":"Biochemistry","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1145/3592307.3592314","is_oa":false,"landing_page_url":"https://doi.org/10.1145/3592307.3592314","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 2023 6th International Conference on Electronics, Communications and Control Engineering","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/4","display_name":"Quality Education","score":0.5600000023841858}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":9,"referenced_works":["https://openalex.org/W2950898568","https://openalex.org/W2963716836","https://openalex.org/W3158433122","https://openalex.org/W3204163667","https://openalex.org/W3208979922","https://openalex.org/W4285723986","https://openalex.org/W6685265622","https://openalex.org/W6690815549","https://openalex.org/W6848935878"],"related_works":["https://openalex.org/W2468279273","https://openalex.org/W2354198838","https://openalex.org/W1989130879","https://openalex.org/W2103419012","https://openalex.org/W2988126442","https://openalex.org/W1974414866","https://openalex.org/W2057568687","https://openalex.org/W2063982682","https://openalex.org/W2338543196","https://openalex.org/W1544691147"],"abstract_inverted_index":{"Artificial":[0],"intelligence":[1],"has":[2,82],"been":[3,50,67],"developed":[4],"in":[5,25,57,86],"many":[6,32],"fields":[7],"due":[8],"to":[9,101],"the":[10,14,18,26,73,133,141,144,149,167],"rapid":[11,19],"spread":[12],"of":[13,21,34,75,135,143,157],"Internet":[15],"worldwide":[16],"and":[17,46,52,79,108,131,159],"development":[20],"computer":[22,38],"computing":[23],"power":[24],"last":[27],"decade.":[28],"During":[29],"this":[30,123],"development,":[31],"branches":[33],"AI,":[35],"such":[36],"as":[37,98],"vision,":[39],"natural":[40],"language":[41],"processing,":[42],"graph":[43,76,95,137,152,177],"deep":[44,77,96],"learning,":[45,48],"reinforcement":[47,80,113],"have":[49,66],"proposed":[51],"studied,":[53],"making":[54],"AI":[55],"ubiquitous":[56],"people's":[58],"lives":[59],"today.":[60],"In":[61,89,122],"recent":[62],"years,":[63],"cross-domain":[64],"applications":[65],"a":[68,112],"very":[69],"hot":[70],"topic,":[71],"where":[72,166],"combination":[74],"learning":[78,81,97,114],"achieved":[83],"good":[84,172],"results":[85],"several":[87],"fields.":[88],"our":[90,128],"previous":[91,129],"work,":[92],"we":[93,125],"used":[94],"an":[99],"encoder":[100],"encode":[102],"game":[103,107,118,145],"states":[104],"on":[105,127,140],"Tetris":[106],"fed":[109],"it":[110],"into":[111],"algorithm":[115],"for":[116],"training":[117],"agents":[119],"with":[120,154,179],"success.":[121],"paper,":[124],"build":[126],"work":[130],"explore":[132],"impact":[134],"different":[136,155],"construction":[138],"methods":[139],"performance":[142,150,173],"Agent.":[146],"We":[147],"compare":[148],"between":[151],"structures":[153,178],"number":[156],"edges":[158],"finally":[160],"find":[161],"that":[162],"there":[163],"are":[164],"cases":[165],"Game":[168],"Agent":[169],"can":[170],"maintain":[171],"even":[174],"when":[175],"using":[176],"significantly":[180],"fewer":[181],"edges.":[182]},"counts_by_year":[],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}