{"id":"https://openalex.org/W4417492214","doi":"https://doi.org/10.48550/arxiv.2507.15455","title":"Solving nonconvex Hamilton--Jacobi--Isaacs equations with PINN-based policy iteration","display_name":"Solving nonconvex Hamilton--Jacobi--Isaacs equations with PINN-based policy iteration","publication_year":2025,"publication_date":"2025-07-21","ids":{"openalex":"https://openalex.org/W4417492214","doi":"https://doi.org/10.48550/arxiv.2507.15455"},"language":"en","primary_location":{"id":"pmh:oai:arXiv.org:2507.15455","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2507.15455","pdf_url":"https://arxiv.org/pdf/2507.15455","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},"type":"preprint","indexed_in":["arxiv","datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://arxiv.org/pdf/2507.15455","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5085199071","display_name":"Hee Jun Yang","orcid":"https://orcid.org/0000-0003-3628-4562"},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Yang, Hee Jun","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5052505128","display_name":"Minjung Gim","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Gim, Minjung","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5028468023","display_name":"Yeoneung Kim","orcid":"https://orcid.org/0000-0001-6293-3939"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Kim, Yeoneung","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5085199071"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.36329999566078186,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.36329999566078186,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11206","display_name":"Model Reduction and Neural Networks","score":0.3271999955177307,"subfield":{"id":"https://openalex.org/subfields/3109","display_name":"Statistical and Nonlinear Physics"},"field":{"id":"https://openalex.org/fields/31","display_name":"Physics and Astronomy"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.06300000101327896,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/lipschitz-continuity","display_name":"Lipschitz continuity","score":0.7210000157356262},{"id":"https://openalex.org/keywords/iterated-function","display_name":"Iterated function","score":0.6259999871253967},{"id":"https://openalex.org/keywords/convergence","display_name":"Convergence (economics)","score":0.5870000123977661},{"id":"https://openalex.org/keywords/bellman-equation","display_name":"Bellman equation","score":0.5734999775886536},{"id":"https://openalex.org/keywords/pointwise","display_name":"Pointwise","score":0.5503000020980835},{"id":"https://openalex.org/keywords/convexity","display_name":"Convexity","score":0.5425999760627747},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.517799973487854},{"id":"https://openalex.org/keywords/minimax","display_name":"Minimax","score":0.45249998569488525},{"id":"https://openalex.org/keywords/function","display_name":"Function (biology)","score":0.4253000020980835},{"id":"https://openalex.org/keywords/convex-function","display_name":"Convex function","score":0.3968999981880188}],"concepts":[{"id":"https://openalex.org/C22324862","wikidata":"https://www.wikidata.org/wiki/Q652707","display_name":"Lipschitz continuity","level":2,"score":0.7210000157356262},{"id":"https://openalex.org/C140479938","wikidata":"https://www.wikidata.org/wiki/Q5254619","display_name":"Iterated function","level":2,"score":0.6259999871253967},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.5932999849319458},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.5870000123977661},{"id":"https://openalex.org/C14646407","wikidata":"https://www.wikidata.org/wiki/Q1430750","display_name":"Bellman equation","level":2,"score":0.5734999775886536},{"id":"https://openalex.org/C2777984123","wikidata":"https://www.wikidata.org/wiki/Q9248237","display_name":"Pointwise","level":2,"score":0.5503000020980835},{"id":"https://openalex.org/C72134830","wikidata":"https://www.wikidata.org/wiki/Q5166524","display_name":"Convexity","level":2,"score":0.5425999760627747},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.520799994468689},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.517799973487854},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.4587000012397766},{"id":"https://openalex.org/C149728462","wikidata":"https://www.wikidata.org/wiki/Q751319","display_name":"Minimax","level":2,"score":0.45249998569488525},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.4253000020980835},{"id":"https://openalex.org/C145446738","wikidata":"https://www.wikidata.org/wiki/Q319913","display_name":"Convex function","level":3,"score":0.3968999981880188},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.39010000228881836},{"id":"https://openalex.org/C48044578","wikidata":"https://www.wikidata.org/wiki/Q727490","display_name":"Scalability","level":2,"score":0.3646000027656555},{"id":"https://openalex.org/C112680207","wikidata":"https://www.wikidata.org/wiki/Q714886","display_name":"Regular polygon","level":2,"score":0.3296999931335449},{"id":"https://openalex.org/C157709441","wikidata":"https://www.wikidata.org/wiki/Q1411887","display_name":"Uniform convergence","level":3,"score":0.3181999921798706},{"id":"https://openalex.org/C157972887","wikidata":"https://www.wikidata.org/wiki/Q463359","display_name":"Convex optimization","level":3,"score":0.3176000118255615},{"id":"https://openalex.org/C2776036281","wikidata":"https://www.wikidata.org/wiki/Q48769818","display_name":"Constraint (computer-aided design)","level":2,"score":0.3172000050544739},{"id":"https://openalex.org/C51955184","wikidata":"https://www.wikidata.org/wiki/Q1545585","display_name":"Stochastic differential equation","level":2,"score":0.30799999833106995},{"id":"https://openalex.org/C41045048","wikidata":"https://www.wikidata.org/wiki/Q202843","display_name":"Linear programming","level":2,"score":0.2953000068664551},{"id":"https://openalex.org/C159694833","wikidata":"https://www.wikidata.org/wiki/Q2321565","display_name":"Iterative method","level":2,"score":0.29190000891685486},{"id":"https://openalex.org/C2776291640","wikidata":"https://www.wikidata.org/wiki/Q2912517","display_name":"Value (mathematics)","level":2,"score":0.29159998893737793},{"id":"https://openalex.org/C137836250","wikidata":"https://www.wikidata.org/wiki/Q984063","display_name":"Optimization problem","level":2,"score":0.289000004529953},{"id":"https://openalex.org/C37404715","wikidata":"https://www.wikidata.org/wiki/Q380679","display_name":"Dynamic programming","level":2,"score":0.2879999876022339},{"id":"https://openalex.org/C167964875","wikidata":"https://www.wikidata.org/wiki/Q17011487","display_name":"Exponential stability","level":3,"score":0.27950000762939453},{"id":"https://openalex.org/C93226319","wikidata":"https://www.wikidata.org/wiki/Q193137","display_name":"Differential (mechanical device)","level":2,"score":0.27810001373291016},{"id":"https://openalex.org/C2778067643","wikidata":"https://www.wikidata.org/wiki/Q166507","display_name":"Interval (graph theory)","level":2,"score":0.27730000019073486},{"id":"https://openalex.org/C91575142","wikidata":"https://www.wikidata.org/wiki/Q1971426","display_name":"Optimal control","level":2,"score":0.2727999985218048},{"id":"https://openalex.org/C2778029271","wikidata":"https://www.wikidata.org/wiki/Q5421931","display_name":"Extension (predicate logic)","level":2,"score":0.27149999141693115},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.262800008058548},{"id":"https://openalex.org/C72169020","wikidata":"https://www.wikidata.org/wiki/Q194404","display_name":"Monotonic function","level":2,"score":0.26010000705718994},{"id":"https://openalex.org/C88731125","wikidata":"https://www.wikidata.org/wiki/Q7935676","display_name":"Viscosity solution","level":2,"score":0.257999986410141},{"id":"https://openalex.org/C85189116","wikidata":"https://www.wikidata.org/wiki/Q374195","display_name":"Newton's method","level":3,"score":0.25589999556541443},{"id":"https://openalex.org/C2776359362","wikidata":"https://www.wikidata.org/wiki/Q2145286","display_name":"Representation (politics)","level":3,"score":0.2549999952316284},{"id":"https://openalex.org/C91873725","wikidata":"https://www.wikidata.org/wiki/Q3445816","display_name":"Function approximation","level":3,"score":0.25110000371932983},{"id":"https://openalex.org/C27156116","wikidata":"https://www.wikidata.org/wiki/Q1778098","display_name":"Pointwise convergence","level":3,"score":0.250900000333786}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:oai:arXiv.org:2507.15455","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2507.15455","pdf_url":"https://arxiv.org/pdf/2507.15455","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},{"id":"doi:10.48550/arxiv.2507.15455","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2507.15455","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:oai:arXiv.org:2507.15455","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2507.15455","pdf_url":"https://arxiv.org/pdf/2507.15455","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"We":[0],"propose":[1],"a":[2,111,117,165],"mesh-free":[3],"policy":[4,162],"iteration":[5,163],"framework":[6],"that":[7,64,158],"combines":[8],"classical":[9],"dynamic":[10],"programming":[11],"with":[12,116,125,137,161,177],"physics-informed":[13],"neural":[14],"networks":[15],"(PINNs)":[16],"to":[17,72],"solve":[18],"high-dimensional,":[19,173],"nonconvex":[20,174],"Hamilton--Jacobi--Isaacs":[21],"(HJI)":[22],"equations":[23],"arising":[24],"in":[25,180],"stochastic":[26,113],"differential":[27,135],"games":[28,136],"and":[29,44,58,92,105,132,152,167,183],"robust":[30],"control.":[31],"The":[32,81],"method":[33,121,170],"alternates":[34],"between":[35],"solving":[36,172],"linear":[37],"second-order":[38],"PDEs":[39],"under":[40],"fixed":[41],"feedback":[42],"policies":[43],"updating":[45],"the":[46,65,73,78,87,98,103,108,140],"controls":[47],"via":[48],"pointwise":[49],"minimax":[50],"optimization":[51],"using":[52],"automatic":[53],"differentiation.":[54],"Under":[55],"standard":[56],"Lipschitz":[57],"uniform":[59],"ellipticity":[60],"assumptions,":[61],"we":[62],"prove":[63],"value":[66,150],"function":[67],"iterates":[68],"converge":[69],"locally":[70],"uniformly":[71],"unique":[74],"viscosity":[75],"solution":[76],"of":[77,86,97,107],"HJI":[79,175],"equation.":[80],"analysis":[82],"establishes":[83],"equi-Lipschitz":[84],"regularity":[85],"iterates,":[88],"enabling":[89],"provable":[90],"stability":[91],"convergence":[93],"without":[94],"requiring":[95],"convexity":[96],"Hamiltonian.":[99],"Numerical":[100],"experiments":[101],"demonstrate":[102],"accuracy":[104],"scalability":[106],"method.":[109],"In":[110,130],"two-dimensional":[112],"path-planning":[114],"game":[115],"moving":[118],"obstacle,":[119],"our":[120],"matches":[122],"finite-difference":[123],"benchmarks":[124],"relative":[126],"$L^2$-errors":[127],"below":[128],"%10^{-2}%.":[129],"five-":[131],"ten-dimensional":[133],"publisher-subscriber":[134],"anisotropic":[138],"noise,":[139],"proposed":[141],"approach":[142],"consistently":[143],"outperforms":[144],"direct":[145],"PINN":[146],"solvers,":[147],"yielding":[148],"smoother":[149],"functions":[151],"lower":[153],"residuals.":[154],"Our":[155],"results":[156],"suggest":[157],"integrating":[159],"PINNs":[160],"is":[164],"practical":[166],"theoretically":[168],"grounded":[169],"for":[171],"equations,":[176],"potential":[178],"applications":[179],"robotics,":[181],"finance,":[182],"multi-agent":[184],"reinforcement":[185],"learning.":[186]},"counts_by_year":[],"updated_date":"2026-03-07T16:01:11.037858","created_date":"2025-10-10T00:00:00"}