{"id":"https://openalex.org/W7134851968","doi":"https://doi.org/10.48550/arxiv.2603.06587","title":"Autonomous AI Agents for Option Hedging: Enhancing Financial Stability through Shortfall Aware Reinforcement Learning","display_name":"Autonomous AI Agents for Option Hedging: Enhancing Financial Stability through Shortfall Aware Reinforcement Learning","publication_year":2026,"publication_date":"2026-02-01","ids":{"openalex":"https://openalex.org/W7134851968","doi":"https://doi.org/10.48550/arxiv.2603.06587"},"language":null,"primary_location":{"id":"pmh:doi:10.48550/arxiv.2603.06587","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"publisher-specific-oa","license_id":"https://openalex.org/licenses/publisher-specific-oa","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":null,"any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5122157456","display_name":"Minxuan Hu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Hu, Minxuan","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128677046","display_name":"Ziheng Chen","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Chen, Ziheng","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5128657881","display_name":"Jiayu Yi","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Yi, Jiayu","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5128646841","display_name":"Wenxi Sun","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Sun, Wenxi","raw_affiliation_strings":[],"raw_orcid":null,"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":4,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11413","display_name":"Risk and Portfolio Optimization","score":0.24050000309944153,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T11413","display_name":"Risk and Portfolio Optimization","score":0.24050000309944153,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T11326","display_name":"Stock Market Forecasting Methods","score":0.0885000005364418,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10067","display_name":"Stochastic processes and financial applications","score":0.0786999985575676,"subfield":{"id":"https://openalex.org/subfields/2003","display_name":"Finance"},"field":{"id":"https://openalex.org/fields/20","display_name":"Economics, Econometrics and Finance"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7451000213623047},{"id":"https://openalex.org/keywords/expected-shortfall","display_name":"Expected shortfall","score":0.593999981880188},{"id":"https://openalex.org/keywords/volatility","display_name":"Volatility (finance)","score":0.4893999993801117},{"id":"https://openalex.org/keywords/risk-management","display_name":"Risk management","score":0.42750000953674316},{"id":"https://openalex.org/keywords/financial-market","display_name":"Financial market","score":0.4034000039100647},{"id":"https://openalex.org/keywords/downside-risk","display_name":"Downside risk","score":0.40310001373291016},{"id":"https://openalex.org/keywords/stability","display_name":"Stability (learning theory)","score":0.36039999127388},{"id":"https://openalex.org/keywords/calibration","display_name":"Calibration","score":0.34310001134872437}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7451000213623047},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6240000128746033},{"id":"https://openalex.org/C5496284","wikidata":"https://www.wikidata.org/wiki/Q5420856","display_name":"Expected shortfall","level":3,"score":0.593999981880188},{"id":"https://openalex.org/C91602232","wikidata":"https://www.wikidata.org/wiki/Q756115","display_name":"Volatility (finance)","level":2,"score":0.4893999993801117},{"id":"https://openalex.org/C32896092","wikidata":"https://www.wikidata.org/wiki/Q189447","display_name":"Risk management","level":2,"score":0.42750000953674316},{"id":"https://openalex.org/C19244329","wikidata":"https://www.wikidata.org/wiki/Q208697","display_name":"Financial market","level":2,"score":0.4034000039100647},{"id":"https://openalex.org/C2776719154","wikidata":"https://www.wikidata.org/wiki/Q1094965","display_name":"Downside risk","level":3,"score":0.40310001373291016},{"id":"https://openalex.org/C112972136","wikidata":"https://www.wikidata.org/wiki/Q7595718","display_name":"Stability (learning theory)","level":2,"score":0.36039999127388},{"id":"https://openalex.org/C165838908","wikidata":"https://www.wikidata.org/wiki/Q736777","display_name":"Calibration","level":2,"score":0.34310001134872437},{"id":"https://openalex.org/C2778414658","wikidata":"https://www.wikidata.org/wiki/Q1409206","display_name":"Model risk","level":3,"score":0.33649998903274536},{"id":"https://openalex.org/C125014702","wikidata":"https://www.wikidata.org/wiki/Q4680749","display_name":"Adaptive learning","level":2,"score":0.3294999897480011},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.32249999046325684},{"id":"https://openalex.org/C117251300","wikidata":"https://www.wikidata.org/wiki/Q1849855","display_name":"Parametric statistics","level":2,"score":0.31450000405311584},{"id":"https://openalex.org/C2776734221","wikidata":"https://www.wikidata.org/wiki/Q3936425","display_name":"Tail risk","level":2,"score":0.30979999899864197},{"id":"https://openalex.org/C194483076","wikidata":"https://www.wikidata.org/wiki/Q380382","display_name":"Valuation of options","level":2,"score":0.3057999908924103},{"id":"https://openalex.org/C149782125","wikidata":"https://www.wikidata.org/wiki/Q160039","display_name":"Econometrics","level":1,"score":0.3034999966621399},{"id":"https://openalex.org/C188116033","wikidata":"https://www.wikidata.org/wiki/Q2664563","display_name":"Q-learning","level":3,"score":0.30320000648498535},{"id":"https://openalex.org/C112930515","wikidata":"https://www.wikidata.org/wiki/Q4389547","display_name":"Risk analysis (engineering)","level":1,"score":0.29269999265670776},{"id":"https://openalex.org/C2781067378","wikidata":"https://www.wikidata.org/wiki/Q17027399","display_name":"Interpretability","level":2,"score":0.2919999957084656},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.28439998626708984},{"id":"https://openalex.org/C105339364","wikidata":"https://www.wikidata.org/wiki/Q2297740","display_name":"Software deployment","level":2,"score":0.27889999747276306},{"id":"https://openalex.org/C2779922397","wikidata":"https://www.wikidata.org/wiki/Q5014755","display_name":"CVAR","level":4,"score":0.2685999870300293},{"id":"https://openalex.org/C162324750","wikidata":"https://www.wikidata.org/wiki/Q8134","display_name":"Economics","level":0,"score":0.2685000002384186},{"id":"https://openalex.org/C3019869117","wikidata":"https://www.wikidata.org/wiki/Q42240","display_name":"Original research","level":2,"score":0.2590000033378601},{"id":"https://openalex.org/C162118730","wikidata":"https://www.wikidata.org/wiki/Q1128453","display_name":"Actuarial science","level":1,"score":0.25690001249313354}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:doi:10.48550/arxiv.2603.06587","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"publisher-specific-oa","license_id":"https://openalex.org/licenses/publisher-specific-oa","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},{"id":"doi:10.48550/arxiv.2603.06587","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2603.06587","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:doi:10.48550/arxiv.2603.06587","is_oa":true,"landing_page_url":null,"pdf_url":null,"source":{"id":"https://openalex.org/S4406922384","display_name":"Open MIND","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":"publisher-specific-oa","license_id":"https://openalex.org/licenses/publisher-specific-oa","version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"Article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"The":[0],"deployment":[1],"of":[2,32,41],"autonomous":[3,123],"AI":[4],"agents":[5],"in":[6,43,89,98],"derivatives":[7,124],"markets":[8],"has":[9],"widened":[10],"a":[11,28,119],"practical":[12,120],"gap":[13],"between":[14],"static":[15],"model":[16],"calibration":[17],"and":[18,37,50,61,76,92],"realized":[19,68],"hedging":[20,71,112],"outcomes.":[21],"We":[22],"introduce":[23],"two":[24],"reinforcement":[25],"learning":[26,52],"frameworks,":[27],"novel":[29],"Replication":[30],"Learning":[31],"Option":[33],"Pricing":[34],"(RLOP)":[35],"approach":[36,121],"an":[38],"adaptive":[39],"extension":[40],"Q-learner":[42],"Black-Scholes":[44],"(QLBS),":[45],"that":[46],"prioritize":[47],"shortfall":[48,74,87],"probability":[49],"align":[51],"objectives":[53],"with":[54],"downside":[55],"sensitive":[56],"hedging.":[57],"Using":[58],"listed":[59],"SPY":[60],"XOP":[62],"options,":[63],"we":[64],"evaluate":[65],"models":[66,107],"using":[67],"path":[69],"delta":[70],"outcome":[72],"distributions,":[73],"probability,":[75],"tail":[77],"risk":[78,125],"measures":[79],"such":[80],"as":[81,127],"Expected":[82],"Shortfall.":[83],"Empirically,":[84],"RLOP":[85],"reduces":[86],"frequency":[88],"most":[90],"slices":[91],"shows":[93],"the":[94],"clearest":[95],"tail-risk":[96],"improvements":[97],"stress,":[99],"while":[100],"implied":[101],"volatility":[102],"fit":[103],"often":[104],"favors":[105],"parametric":[106],"yet":[108],"poorly":[109],"predicts":[110],"after-cost":[111],"performance.":[113],"This":[114],"friction-aware":[115],"RL":[116],"framework":[117],"supports":[118],"to":[122],"management":[126],"AI-augmented":[128],"trading":[129],"systems":[130],"scale.":[131]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2026-03-11T00:00:00"}