{"id":"https://openalex.org/W2976641768","doi":"https://doi.org/10.1109/cig.2019.8848014","title":"A Self-Play Policy Optimization Approach to Battling Pok\u00e9mon","display_name":"A Self-Play Policy Optimization Approach to Battling Pok\u00e9mon","publication_year":2019,"publication_date":"2019-08-01","ids":{"openalex":"https://openalex.org/W2976641768","doi":"https://doi.org/10.1109/cig.2019.8848014","mag":"2976641768"},"language":"en","primary_location":{"id":"doi:10.1109/cig.2019.8848014","is_oa":false,"landing_page_url":"https://doi.org/10.1109/cig.2019.8848014","pdf_url":null,"source":{"id":"https://openalex.org/S4306498491","display_name":"2019 IEEE Conference on Games (CoG)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2019 IEEE Conference on Games (CoG)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5108443837","display_name":"Dan Huang","orcid":null},"institutions":[{"id":"https://openalex.org/I76766440","display_name":"University of San Francisco","ror":"https://ror.org/029m7xn54","country_code":"US","type":"education","lineage":["https://openalex.org/I76766440"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Dan Huang","raw_affiliation_strings":["\u2003, San Francisco, CA, United States",", San Francisco, CA, United States"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"\u2003, San Francisco, CA, United States","institution_ids":["https://openalex.org/I76766440"]},{"raw_affiliation_string":", San Francisco, CA, United States","institution_ids":[]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5026638199","display_name":"Scott Lee","orcid":"https://orcid.org/0000-0003-4584-6758"},"institutions":[{"id":"https://openalex.org/I204250578","display_name":"University of California, Irvine","ror":"https://ror.org/04gyf1771","country_code":"US","type":"education","lineage":["https://openalex.org/I204250578"]},{"id":"https://openalex.org/I4210140791","display_name":"Irvine University","ror":"https://ror.org/04ysmca02","country_code":"US","type":"education","lineage":["https://openalex.org/I4210140791"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Scott Lee","raw_affiliation_strings":["\u2003, Irvine, CA, United States",", Irvine, CA, United States"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"\u2003, Irvine, CA, United States","institution_ids":["https://openalex.org/I204250578","https://openalex.org/I4210140791"]},{"raw_affiliation_string":", Irvine, CA, United States","institution_ids":[]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.133,"has_fulltext":false,"cited_by_count":4,"citation_normalized_percentile":{"value":0.50464449,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":97},"biblio":{"volume":null,"issue":null,"first_page":"1","last_page":"4"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11574","display_name":"Artificial Intelligence in Games","score":0.9998000264167786,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T11574","display_name":"Artificial Intelligence in Games","score":0.9998000264167786,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9995999932289124,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11197","display_name":"Digital Games and Media","score":0.9847999811172485,"subfield":{"id":"https://openalex.org/subfields/3312","display_name":"Sociology and Political Science"},"field":{"id":"https://openalex.org/fields/33","display_name":"Social Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7774772644042969},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.684091329574585},{"id":"https://openalex.org/keywords/transferability","display_name":"Transferability","score":0.639690101146698},{"id":"https://openalex.org/keywords/video-game","display_name":"Video game","score":0.6265988945960999},{"id":"https://openalex.org/keywords/variety","display_name":"Variety (cybernetics)","score":0.5830658674240112},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.5197943449020386},{"id":"https://openalex.org/keywords/state","display_name":"State (computer science)","score":0.4795220196247101},{"id":"https://openalex.org/keywords/franchise","display_name":"Franchise","score":0.4473671615123749},{"id":"https://openalex.org/keywords/human\u2013computer-interaction","display_name":"Human\u2013computer interaction","score":0.4472917318344116},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.34458255767822266},{"id":"https://openalex.org/keywords/multimedia","display_name":"Multimedia","score":0.22999060153961182},{"id":"https://openalex.org/keywords/programming-language","display_name":"Programming language","score":0.10258504748344421},{"id":"https://openalex.org/keywords/business","display_name":"Business","score":0.07898056507110596}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7774772644042969},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.684091329574585},{"id":"https://openalex.org/C61272859","wikidata":"https://www.wikidata.org/wiki/Q7834031","display_name":"Transferability","level":3,"score":0.639690101146698},{"id":"https://openalex.org/C3018412434","wikidata":"https://www.wikidata.org/wiki/Q7889","display_name":"Video game","level":2,"score":0.6265988945960999},{"id":"https://openalex.org/C136197465","wikidata":"https://www.wikidata.org/wiki/Q1729295","display_name":"Variety (cybernetics)","level":2,"score":0.5830658674240112},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5197943449020386},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.4795220196247101},{"id":"https://openalex.org/C2778440429","wikidata":"https://www.wikidata.org/wiki/Q171947","display_name":"Franchise","level":2,"score":0.4473671615123749},{"id":"https://openalex.org/C107457646","wikidata":"https://www.wikidata.org/wiki/Q207434","display_name":"Human\u2013computer interaction","level":1,"score":0.4472917318344116},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.34458255767822266},{"id":"https://openalex.org/C49774154","wikidata":"https://www.wikidata.org/wiki/Q131765","display_name":"Multimedia","level":1,"score":0.22999060153961182},{"id":"https://openalex.org/C199360897","wikidata":"https://www.wikidata.org/wiki/Q9143","display_name":"Programming language","level":1,"score":0.10258504748344421},{"id":"https://openalex.org/C144133560","wikidata":"https://www.wikidata.org/wiki/Q4830453","display_name":"Business","level":0,"score":0.07898056507110596},{"id":"https://openalex.org/C178550888","wikidata":"https://www.wikidata.org/wiki/Q2043282","display_name":"Business administration","level":1,"score":0.0},{"id":"https://openalex.org/C140331021","wikidata":"https://www.wikidata.org/wiki/Q1868104","display_name":"Logit","level":2,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/cig.2019.8848014","is_oa":false,"landing_page_url":"https://doi.org/10.1109/cig.2019.8848014","pdf_url":null,"source":{"id":"https://openalex.org/S4306498491","display_name":"2019 IEEE Conference on Games (CoG)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"conference"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2019 IEEE Conference on Games (CoG)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":7,"referenced_works":["https://openalex.org/W1191599655","https://openalex.org/W2156737235","https://openalex.org/W2736601468","https://openalex.org/W2765906968","https://openalex.org/W6627932998","https://openalex.org/W6683195989","https://openalex.org/W6741002519"],"related_works":["https://openalex.org/W4399895933","https://openalex.org/W2161221533","https://openalex.org/W4229699405","https://openalex.org/W1666484574","https://openalex.org/W638103492","https://openalex.org/W2216382288","https://openalex.org/W2355491300","https://openalex.org/W4234629551","https://openalex.org/W4387716901","https://openalex.org/W2011110943"],"abstract_inverted_index":{"Pok\u00e9mon":[0,100],"is":[1,86],"a":[2,9,31,44,67,111,132],"popular":[3,112],"role-playing":[4],"video":[5],"game":[6,22],"franchise":[7],"with":[8,92],"long-lived":[10],"competitive":[11,53,106],"scene":[12],"that":[13,26,83],"has":[14],"evolved":[15],"throughout":[16],"the":[17,52,57,84,93,96,118],"last":[18],"two":[19],"decades.":[20],"The":[21,59],"exhibits":[23],"several":[24],"properties":[25],"come":[27],"together":[28],"to":[29,37,51,72],"present":[30,43],"worthy":[32],"challenge":[33],"for":[34],"AI":[35],"agents":[36],"tackle.":[38],"In":[39],"this":[40],"work,":[41],"we":[42,116],"low-cost":[45],"self-play":[46],"based":[47],"reinforcement":[48],"learning":[49],"approach":[50],"battling":[54],"aspect":[55],"of":[56,69,77,88,95,120],"game.":[58],"proposed":[60],"agent":[61,85,124],"was":[62],"tested":[63],"and":[64],"trained":[65,121,125],"in":[66,98,126,131],"variety":[68],"environments":[70],"designed":[71],"simulate":[73],"possible":[74],"use":[75],"cases":[76],"such":[78],"an":[79,123],"AI.":[80],"Experiments":[81],"demonstrate":[82],"capable":[87],"performing":[89],"on":[90,110],"par":[91],"state":[94],"art":[97],"search-based":[99],"AI,":[101],"as":[102,104],"well":[103,130],"being":[105],"with\u0301":[107],"human":[108],"players":[109],"matchmaking":[113],"ladder.":[114],"Furthermore,":[115],"investigate":[117],"transferability":[119],"skill-whether":[122],"one":[127],"environment":[128],"performs":[129],"different":[133],"environment.":[134]},"counts_by_year":[{"year":2024,"cited_by_count":3},{"year":2020,"cited_by_count":1}],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-10-10T00:00:00"}