{"id":"https://openalex.org/W3004819735","doi":"https://doi.org/10.1142/s0219198920400083","title":"A Policy Improvement Algorithm for Solving a Mixture Class of Perfect Information and AR-AT Semi-Markov Games","display_name":"A Policy Improvement Algorithm for Solving a Mixture Class of Perfect Information and AR-AT Semi-Markov Games","publication_year":2020,"publication_date":"2020-02-04","ids":{"openalex":"https://openalex.org/W3004819735","doi":"https://doi.org/10.1142/s0219198920400083","mag":"3004819735"},"language":"en","primary_location":{"id":"doi:10.1142/s0219198920400083","is_oa":false,"landing_page_url":"https://doi.org/10.1142/s0219198920400083","pdf_url":null,"source":{"id":"https://openalex.org/S130757258","display_name":"International Game Theory Review","issn_l":"0219-1989","issn":["0219-1989","1793-6675"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319815","host_organization_name":"World Scientific","host_organization_lineage":["https://openalex.org/P4310319815"],"host_organization_lineage_names":["World Scientific"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"International Game Theory Review","raw_type":"journal-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5047197698","display_name":"Prasenjit Mondal","orcid":"https://orcid.org/0000-0002-6319-4098"},"institutions":[{"id":"https://openalex.org/I2801141804","display_name":"Bankura University","ror":"https://ror.org/01rn1eg28","country_code":"IN","type":"education","lineage":["https://openalex.org/I2801141804"]}],"countries":["IN"],"is_corresponding":true,"raw_author_name":"P. Mondal","raw_affiliation_strings":["Mathematics Department, Government General Degree College, Ranibandh, Bankura 722135, India"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Mathematics Department, Government General Degree College, Ranibandh, Bankura 722135, India","institution_ids":["https://openalex.org/I2801141804"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5007628003","display_name":"Sarmistha Neogy","orcid":"https://orcid.org/0000-0003-1497-671X"},"institutions":[{"id":"https://openalex.org/I6498739","display_name":"Indian Statistical Institute","ror":"https://ror.org/00q2w1j53","country_code":"IN","type":"education","lineage":["https://openalex.org/I6498739"]}],"countries":["IN"],"is_corresponding":false,"raw_author_name":"S. K. Neogy","raw_affiliation_strings":["Indian Statistical Institute, Delhi Centre, New Delhi 110016, India"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Indian Statistical Institute, Delhi Centre, New Delhi 110016, India","institution_ids":["https://openalex.org/I6498739"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5010105067","display_name":"Abhijit Sen Gupta","orcid":"https://orcid.org/0000-0003-3689-2189"},"institutions":[{"id":"https://openalex.org/I6498739","display_name":"Indian Statistical Institute","ror":"https://ror.org/00q2w1j53","country_code":"IN","type":"education","lineage":["https://openalex.org/I6498739"]}],"countries":["IN"],"is_corresponding":false,"raw_author_name":"A. Gupta","raw_affiliation_strings":["Indian Statistical Institute, Kolkata Centre, Kolkata 700108, India"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Indian Statistical Institute, Kolkata Centre, Kolkata 700108, India","institution_ids":["https://openalex.org/I6498739"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5017410768","display_name":"Debasish Ghorui","orcid":"https://orcid.org/0000-0003-2637-8426"},"institutions":[{"id":"https://openalex.org/I170979836","display_name":"Jadavpur University","ror":"https://ror.org/02af4h012","country_code":"IN","type":"education","lineage":["https://openalex.org/I170979836"]}],"countries":["IN"],"is_corresponding":false,"raw_author_name":"D. Ghorui","raw_affiliation_strings":["Mathematics Department, Jadavpur University, Kolkata 700032, India"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Mathematics Department, Jadavpur University, Kolkata 700032, India","institution_ids":["https://openalex.org/I170979836"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":["https://openalex.org/A5047197698"],"corresponding_institution_ids":["https://openalex.org/I2801141804"],"apc_list":null,"apc_paid":null,"fwci":0.3718,"has_fulltext":false,"cited_by_count":2,"citation_normalized_percentile":{"value":0.64029024,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":94},"biblio":{"volume":"22","issue":"02","first_page":"2040008","last_page":"2040008"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11031","display_name":"Game Theory and Applications","score":0.9961000084877014,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T11031","display_name":"Game Theory and Applications","score":0.9961000084877014,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9958999752998352,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11182","display_name":"Auction Theory and Applications","score":0.983299970626831,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/markov-chain","display_name":"Markov chain","score":0.7967022657394409},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.6685451865196228},{"id":"https://openalex.org/keywords/class","display_name":"Class (philosophy)","score":0.6536182761192322},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.6283189654350281},{"id":"https://openalex.org/keywords/action","display_name":"Action (physics)","score":0.5575058460235596},{"id":"https://openalex.org/keywords/property","display_name":"Property (philosophy)","score":0.4943056106567383},{"id":"https://openalex.org/keywords/markov-perfect-equilibrium","display_name":"Markov perfect equilibrium","score":0.4783684313297272},{"id":"https://openalex.org/keywords/state","display_name":"State (computer science)","score":0.4333266019821167},{"id":"https://openalex.org/keywords/markov-model","display_name":"Markov model","score":0.429743230342865},{"id":"https://openalex.org/keywords/zero","display_name":"Zero (linguistics)","score":0.4156002700328827},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.40338966250419617},{"id":"https://openalex.org/keywords/discrete-mathematics","display_name":"Discrete mathematics","score":0.3783491849899292},{"id":"https://openalex.org/keywords/mathematical-economics","display_name":"Mathematical economics","score":0.3764823079109192},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.37565237283706665},{"id":"https://openalex.org/keywords/combinatorics","display_name":"Combinatorics","score":0.3513408601284027},{"id":"https://openalex.org/keywords/nash-equilibrium","display_name":"Nash equilibrium","score":0.28120413422584534},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.2526780366897583},{"id":"https://openalex.org/keywords/algorithm","display_name":"Algorithm","score":0.21528148651123047},{"id":"https://openalex.org/keywords/statistics","display_name":"Statistics","score":0.0960933268070221},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.07978427410125732}],"concepts":[{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.7967022657394409},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.6685451865196228},{"id":"https://openalex.org/C2777212361","wikidata":"https://www.wikidata.org/wiki/Q5127848","display_name":"Class (philosophy)","level":2,"score":0.6536182761192322},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.6283189654350281},{"id":"https://openalex.org/C2780791683","wikidata":"https://www.wikidata.org/wiki/Q846785","display_name":"Action (physics)","level":2,"score":0.5575058460235596},{"id":"https://openalex.org/C189950617","wikidata":"https://www.wikidata.org/wiki/Q937228","display_name":"Property (philosophy)","level":2,"score":0.4943056106567383},{"id":"https://openalex.org/C67091656","wikidata":"https://www.wikidata.org/wiki/Q6771328","display_name":"Markov perfect equilibrium","level":3,"score":0.4783684313297272},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.4333266019821167},{"id":"https://openalex.org/C163836022","wikidata":"https://www.wikidata.org/wiki/Q6771326","display_name":"Markov model","level":3,"score":0.429743230342865},{"id":"https://openalex.org/C2780813799","wikidata":"https://www.wikidata.org/wiki/Q3274237","display_name":"Zero (linguistics)","level":2,"score":0.4156002700328827},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.40338966250419617},{"id":"https://openalex.org/C118615104","wikidata":"https://www.wikidata.org/wiki/Q121416","display_name":"Discrete mathematics","level":1,"score":0.3783491849899292},{"id":"https://openalex.org/C144237770","wikidata":"https://www.wikidata.org/wiki/Q747534","display_name":"Mathematical economics","level":1,"score":0.3764823079109192},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.37565237283706665},{"id":"https://openalex.org/C114614502","wikidata":"https://www.wikidata.org/wiki/Q76592","display_name":"Combinatorics","level":1,"score":0.3513408601284027},{"id":"https://openalex.org/C46814582","wikidata":"https://www.wikidata.org/wiki/Q23389","display_name":"Nash equilibrium","level":2,"score":0.28120413422584534},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.2526780366897583},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.21528148651123047},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.0960933268070221},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.07978427410125732},{"id":"https://openalex.org/C41895202","wikidata":"https://www.wikidata.org/wiki/Q8162","display_name":"Linguistics","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C138885662","wikidata":"https://www.wikidata.org/wiki/Q5891","display_name":"Philosophy","level":0,"score":0.0},{"id":"https://openalex.org/C111472728","wikidata":"https://www.wikidata.org/wiki/Q9471","display_name":"Epistemology","level":1,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1142/s0219198920400083","is_oa":false,"landing_page_url":"https://doi.org/10.1142/s0219198920400083","pdf_url":null,"source":{"id":"https://openalex.org/S130757258","display_name":"International Game Theory Review","issn_l":"0219-1989","issn":["0219-1989","1793-6675"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319815","host_organization_name":"World Scientific","host_organization_lineage":["https://openalex.org/P4310319815"],"host_organization_lineage_names":["World Scientific"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"International Game Theory Review","raw_type":"journal-article"},{"id":"pmh:oai:RePEc:wsi:igtrxx:v:22:y:2020:i:02:n:s0219198920400083","is_oa":false,"landing_page_url":"http://www.worldscientific.com/doi/abs/10.1142/S0219198920400083","pdf_url":null,"source":{"id":"https://openalex.org/S4306401271","display_name":"RePEc: Research Papers in Economics","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I77793887","host_organization_name":"Federal Reserve Bank of St. Louis","host_organization_lineage":["https://openalex.org/I77793887"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/16","display_name":"Peace, Justice and strong institutions","score":0.800000011920929}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":17,"referenced_works":["https://openalex.org/W1496590343","https://openalex.org/W1983009109","https://openalex.org/W1986389067","https://openalex.org/W1997962584","https://openalex.org/W2005808873","https://openalex.org/W2009376423","https://openalex.org/W2016975439","https://openalex.org/W2040464681","https://openalex.org/W2057517990","https://openalex.org/W2068697957","https://openalex.org/W2127060203","https://openalex.org/W2139301602","https://openalex.org/W2314003728","https://openalex.org/W2321292752","https://openalex.org/W2395105415","https://openalex.org/W3122224521","https://openalex.org/W4254547512"],"related_works":["https://openalex.org/W187740018","https://openalex.org/W2162286586","https://openalex.org/W4255368532","https://openalex.org/W3126873283","https://openalex.org/W4376457996","https://openalex.org/W2393621008","https://openalex.org/W4317465184","https://openalex.org/W2540690809","https://openalex.org/W2995598024","https://openalex.org/W2353273130"],"abstract_inverted_index":{"Zero-sum":[0],"two-person":[1],"discounted":[2,70],"semi-Markov":[3,71,78,99],"games":[4],"with":[5,25],"finite":[6],"state":[7],"and":[8,34,80],"action":[9],"spaces":[10],"are":[11,112],"studied":[12],"where":[13],"a":[14,43,64,85,96,115],"collection":[15,27],"of":[16,28,47,53,77,95,117],"states":[17,29,108],"having":[18,30,109],"Perfect":[19],"Information":[20],"(PI)":[21],"property":[22,111],"is":[23],"mixed":[24],"another":[26],"Additive":[31],"Reward\u2013Additive":[32],"Transition":[33,37],"Action":[35],"Independent":[36],"Time":[38],"(AR-AT-AITT)":[39],"property.":[40],"For":[41],"such":[42],"PI/AR-AT-AITT":[44,97],"mixture":[45,98],"class":[46],"games,":[48],"we":[49,83,102],"prove":[50],"the":[51,107],"existence":[52],"an":[54,91],"optimal":[55,92],"pure":[56],"stationary":[57],"strategy":[58,93],"for":[59,68,89],"each":[60],"player.":[61],"We":[62],"develop":[63],"policy":[65],"improvement":[66],"algorithm":[67,88],"solving":[69],"decision":[72],"processes":[73],"(one":[74],"player":[75],"version":[76],"games)":[79],"using":[81],"it":[82],"obtain":[84],"policy-improvement":[86],"type":[87],"computing":[90],"pair":[94],"game.":[100],"Finally,":[101],"extend":[103],"our":[104],"results":[105],"when":[106],"PI":[110],"replaced":[113],"by":[114],"subclass":[116],"Switching":[118],"Control":[119],"(SC)":[120],"states.":[121]},"counts_by_year":[{"year":2022,"cited_by_count":1},{"year":2021,"cited_by_count":1}],"updated_date":"2026-05-21T06:26:12.895304","created_date":"2025-10-10T00:00:00"}