{"id":"https://openalex.org/W4388895075","doi":"https://doi.org/10.1109/tcsii.2023.3335343","title":"Actor-Critic Optimal Control for Semi-Markovian Jump Systems With Time Delay","display_name":"Actor-Critic Optimal Control for Semi-Markovian Jump Systems With Time Delay","publication_year":2023,"publication_date":"2023-11-22","ids":{"openalex":"https://openalex.org/W4388895075","doi":"https://doi.org/10.1109/tcsii.2023.3335343"},"language":"en","primary_location":{"id":"doi:10.1109/tcsii.2023.3335343","is_oa":false,"landing_page_url":"https://doi.org/10.1109/tcsii.2023.3335343","pdf_url":null,"source":{"id":"https://openalex.org/S93916849","display_name":"IEEE Transactions on Circuits & Systems II Express Briefs","issn_l":"1549-7747","issn":["1549-7747","1558-3791"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319808","host_organization_name":"Institute of Electrical and Electronics Engineers","host_organization_lineage":["https://openalex.org/P4310319808"],"host_organization_lineage_names":["Institute of Electrical and Electronics Engineers"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"IEEE Transactions on Circuits and Systems II: Express Briefs","raw_type":"journal-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5100431556","display_name":"Lulu Zhang","orcid":"https://orcid.org/0000-0002-7557-3845"},"institutions":[{"id":"https://openalex.org/I9224756","display_name":"Northeastern University","ror":"https://ror.org/03awzbc87","country_code":"CN","type":"education","lineage":["https://openalex.org/I9224756"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"Lulu Zhang","raw_affiliation_strings":["College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China"],"affiliations":[{"raw_affiliation_string":"College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China","institution_ids":["https://openalex.org/I9224756"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5100625792","display_name":"Huaguang Zhang","orcid":"https://orcid.org/0000-0002-2375-9824"},"institutions":[{"id":"https://openalex.org/I4391767858","display_name":"State Key Laboratory of Synthetical Automation for Process Industries","ror":"https://ror.org/0380ng272","country_code":null,"type":"facility","lineage":["https://openalex.org/I4391767858","https://openalex.org/I9224756"]},{"id":"https://openalex.org/I9224756","display_name":"Northeastern University","ror":"https://ror.org/03awzbc87","country_code":"CN","type":"education","lineage":["https://openalex.org/I9224756"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Huaguang Zhang","raw_affiliation_strings":["State Key Laboratory of Synthetical Automation for Process Industries and the College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China","College of Information Science and Engineering, Northeastern University, Shenyang, China"],"affiliations":[{"raw_affiliation_string":"State Key Laboratory of Synthetical Automation for Process Industries and the College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China","institution_ids":["https://openalex.org/I9224756","https://openalex.org/I4391767858"]},{"raw_affiliation_string":"College of Information Science and Engineering, Northeastern University, Shenyang, China","institution_ids":["https://openalex.org/I9224756"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5046963103","display_name":"Xiaohui Yue","orcid":"https://orcid.org/0000-0002-3309-6008"},"institutions":[{"id":"https://openalex.org/I9224756","display_name":"Northeastern University","ror":"https://ror.org/03awzbc87","country_code":"CN","type":"education","lineage":["https://openalex.org/I9224756"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Xiaohui Yue","raw_affiliation_strings":["College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China"],"affiliations":[{"raw_affiliation_string":"College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China","institution_ids":["https://openalex.org/I9224756"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5052418075","display_name":"Tianbiao Wang","orcid":"https://orcid.org/0000-0002-9533-8383"},"institutions":[{"id":"https://openalex.org/I9224756","display_name":"Northeastern University","ror":"https://ror.org/03awzbc87","country_code":"CN","type":"education","lineage":["https://openalex.org/I9224756"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Tianbiao Wang","raw_affiliation_strings":["College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China"],"affiliations":[{"raw_affiliation_string":"College of Information Science and Engineering, Northeastern University, Shenyang, Liaoning, China","institution_ids":["https://openalex.org/I9224756"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":["https://openalex.org/A5100431556"],"corresponding_institution_ids":["https://openalex.org/I9224756"],"apc_list":null,"apc_paid":null,"fwci":1.0085,"has_fulltext":false,"cited_by_count":5,"citation_normalized_percentile":{"value":0.80312956,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":94,"max":97},"biblio":{"volume":"71","issue":"4","first_page":"2164","last_page":"2168"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":1.0,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":1.0,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9868999719619751,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10040","display_name":"Adaptive Control of Nonlinear Systems","score":0.9696999788284302,"subfield":{"id":"https://openalex.org/subfields/2207","display_name":"Control and Systems Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7082393765449524},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.6412565112113953},{"id":"https://openalex.org/keywords/control-theory","display_name":"Control theory (sociology)","score":0.6297290325164795},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.5950233936309814},{"id":"https://openalex.org/keywords/jump","display_name":"Jump","score":0.5798567533493042},{"id":"https://openalex.org/keywords/jacobian-matrix-and-determinant","display_name":"Jacobian matrix and determinant","score":0.576710045337677},{"id":"https://openalex.org/keywords/temporal-difference-learning","display_name":"Temporal difference learning","score":0.5434018969535828},{"id":"https://openalex.org/keywords/state","display_name":"State (computer science)","score":0.542456865310669},{"id":"https://openalex.org/keywords/nonlinear-system","display_name":"Nonlinear system","score":0.4990983009338379},{"id":"https://openalex.org/keywords/lyapunov-function","display_name":"Lyapunov function","score":0.47934088110923767},{"id":"https://openalex.org/keywords/bellman-equation","display_name":"Bellman equation","score":0.4685284495353699},{"id":"https://openalex.org/keywords/function","display_name":"Function (biology)","score":0.4456711411476135},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.4221058487892151},{"id":"https://openalex.org/keywords/optimal-control","display_name":"Optimal control","score":0.41656461358070374},{"id":"https://openalex.org/keywords/control","display_name":"Control (management)","score":0.3697759211063385},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.3596876263618469},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.3277010917663574},{"id":"https://openalex.org/keywords/algorithm","display_name":"Algorithm","score":0.2239818572998047},{"id":"https://openalex.org/keywords/applied-mathematics","display_name":"Applied mathematics","score":0.1615222990512848},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.1538899540901184}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7082393765449524},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6412565112113953},{"id":"https://openalex.org/C47446073","wikidata":"https://www.wikidata.org/wiki/Q5165890","display_name":"Control theory (sociology)","level":3,"score":0.6297290325164795},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.5950233936309814},{"id":"https://openalex.org/C2780695682","wikidata":"https://www.wikidata.org/wiki/Q4005959","display_name":"Jump","level":2,"score":0.5798567533493042},{"id":"https://openalex.org/C200331156","wikidata":"https://www.wikidata.org/wiki/Q506041","display_name":"Jacobian matrix and determinant","level":2,"score":0.576710045337677},{"id":"https://openalex.org/C196340769","wikidata":"https://www.wikidata.org/wiki/Q7698910","display_name":"Temporal difference learning","level":3,"score":0.5434018969535828},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.542456865310669},{"id":"https://openalex.org/C158622935","wikidata":"https://www.wikidata.org/wiki/Q660848","display_name":"Nonlinear system","level":2,"score":0.4990983009338379},{"id":"https://openalex.org/C60640748","wikidata":"https://www.wikidata.org/wiki/Q2337858","display_name":"Lyapunov function","level":3,"score":0.47934088110923767},{"id":"https://openalex.org/C14646407","wikidata":"https://www.wikidata.org/wiki/Q1430750","display_name":"Bellman equation","level":2,"score":0.4685284495353699},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.4456711411476135},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.4221058487892151},{"id":"https://openalex.org/C91575142","wikidata":"https://www.wikidata.org/wiki/Q1971426","display_name":"Optimal control","level":2,"score":0.41656461358070374},{"id":"https://openalex.org/C2775924081","wikidata":"https://www.wikidata.org/wiki/Q55608371","display_name":"Control (management)","level":2,"score":0.3697759211063385},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.3596876263618469},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.3277010917663574},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.2239818572998047},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.1615222990512848},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.1538899540901184},{"id":"https://openalex.org/C78458016","wikidata":"https://www.wikidata.org/wiki/Q840400","display_name":"Evolutionary biology","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C86803240","wikidata":"https://www.wikidata.org/wiki/Q420","display_name":"Biology","level":0,"score":0.0},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/tcsii.2023.3335343","is_oa":false,"landing_page_url":"https://doi.org/10.1109/tcsii.2023.3335343","pdf_url":null,"source":{"id":"https://openalex.org/S93916849","display_name":"IEEE Transactions on Circuits & Systems II Express Briefs","issn_l":"1549-7747","issn":["1549-7747","1558-3791"],"is_oa":false,"is_in_doaj":false,"is_core":true,"host_organization":"https://openalex.org/P4310319808","host_organization_name":"Institute of Electrical and Electronics Engineers","host_organization_lineage":["https://openalex.org/P4310319808"],"host_organization_lineage_names":["Institute of Electrical and Electronics Engineers"],"type":"journal"},"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"IEEE Transactions on Circuits and Systems II: Express Briefs","raw_type":"journal-article"}],"best_oa_location":null,"sustainable_development_goals":[{"id":"https://metadata.un.org/sdg/16","score":0.6000000238418579,"display_name":"Peace, Justice and strong institutions"}],"awards":[{"id":"https://openalex.org/G1611759704","display_name":null,"funder_award_id":"2022JH25/10100008","funder_id":"https://openalex.org/F4320323086","funder_display_name":"Natural Science Foundation of Liaoning Province"},{"id":"https://openalex.org/G2036897366","display_name":null,"funder_award_id":"61627809","funder_id":"https://openalex.org/F4320321001","funder_display_name":"National Natural Science Foundation of China"},{"id":"https://openalex.org/G837822842","display_name":null,"funder_award_id":"XLYC1801005","funder_id":"https://openalex.org/F4320329895","funder_display_name":"Liaoning Revitalization Talents Program"}],"funders":[{"id":"https://openalex.org/F4320321001","display_name":"National Natural Science Foundation of China","ror":"https://ror.org/01h0zpd94"},{"id":"https://openalex.org/F4320323086","display_name":"Natural Science Foundation of Liaoning Province","ror":null},{"id":"https://openalex.org/F4320329895","display_name":"Liaoning Revitalization Talents Program","ror":null}],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":20,"referenced_works":["https://openalex.org/W2100276679","https://openalex.org/W2137092694","https://openalex.org/W2797305442","https://openalex.org/W2898725434","https://openalex.org/W2902616765","https://openalex.org/W2998108031","https://openalex.org/W3093599339","https://openalex.org/W3127008750","https://openalex.org/W3134891176","https://openalex.org/W3156746875","https://openalex.org/W3189325691","https://openalex.org/W3201695527","https://openalex.org/W4229447068","https://openalex.org/W4285184122","https://openalex.org/W4312679805","https://openalex.org/W4312810991","https://openalex.org/W4315489467","https://openalex.org/W4366310780","https://openalex.org/W4379805448","https://openalex.org/W4380356629"],"related_works":["https://openalex.org/W2149418961","https://openalex.org/W4308702637","https://openalex.org/W4256087190","https://openalex.org/W4240668504","https://openalex.org/W2100100236","https://openalex.org/W3038962357","https://openalex.org/W2971484784","https://openalex.org/W2808418668","https://openalex.org/W61119710","https://openalex.org/W4288112126"],"abstract_inverted_index":{"In":[0],"this":[1,109],"paper,":[2],"an":[3],"actor-critic":[4,55,90],"neural":[5],"network":[6],"(NN)":[7],"framework":[8],"is":[9,39,48,93],"constructed":[10],"to":[11,70,95,128],"address":[12],"the":[13,18,42,45,52,63,73,78,97,106,113,118,122,130,133],"optimal":[14],"regulation":[15],"problem":[16],"of":[17,44,54,117,132],"nonlinear":[19],"semi-Markovian":[20,35],"jump":[21,36],"systems":[22,102],"with":[23,34,103],"state":[24,85],"and":[25,65,86],"input":[26,87],"delays.":[27,88],"Firstly,":[28],"a":[29],"specialized":[30],"cost":[31],"function":[32],"associated":[33],"parameters":[37],"(s-MJPs)":[38],"defined.":[40],"Then,":[41],"resolution":[43],"Hamilton-Jacobian-Bellman":[46],"equation":[47],"ascertained":[49],"based":[50],"on":[51],"application":[53],"NN,":[56],"in":[57],"which":[58],"updating":[59],"laws":[60],"for":[61,100],"both":[62],"actor":[64],"critic":[66],"NNs":[67],"are":[68],"devised":[69],"concomitantly":[71],"execute":[72],"reinforcement":[74],"learning":[75],"strategy.":[76],"Wherein":[77],"temporal":[79],"difference":[80],"error":[81],"takes":[82],"into":[83],"account":[84],"An":[89],"NN":[91],"scheme":[92],"designed":[94],"approximate":[96],"unknown":[98],"dynamic":[99],"time-delay":[101],"s-MJPs.":[104],"Utilizing":[105],"Lyapunov":[107],"method,":[108],"study":[110],"successfully":[111],"demonstrates":[112],"ultimate":[114],"uniform":[115],"boundedness":[116],"considered":[119],"system.":[120],"Finally,":[121],"practical":[123],"simulation":[124],"results":[125],"presented":[126],"serve":[127],"validate":[129],"efficacy":[131],"proposed":[134],"algorithm.":[135]},"counts_by_year":[{"year":2025,"cited_by_count":3},{"year":2024,"cited_by_count":2}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}