{"id":"https://openalex.org/W4416251678","doi":"https://doi.org/10.1109/ijcnn64981.2025.11228590","title":"Reinforcement Learning for Option Hedging Using Quantile Regression and Curriculum Learning with Historical Data Fusion","display_name":"Reinforcement Learning for Option Hedging Using Quantile Regression and Curriculum Learning with Historical Data Fusion","publication_year":2025,"publication_date":"2025-06-30","ids":{"openalex":"https://openalex.org/W4416251678","doi":"https://doi.org/10.1109/ijcnn64981.2025.11228590"},"language":null,"primary_location":{"id":"doi:10.1109/ijcnn64981.2025.11228590","is_oa":false,"landing_page_url":"https://doi.org/10.1109/ijcnn64981.2025.11228590","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2025 International Joint Conference on Neural Networks (IJCNN)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5108681526","display_name":"Qiao Pan","orcid":"https://orcid.org/0009-0004-1797-8643"},"institutions":[{"id":"https://openalex.org/I181326427","display_name":"Donghua University","ror":"https://ror.org/035psfh38","country_code":"CN","type":"education","lineage":["https://openalex.org/I181326427"]}],"countries":["CN"],"is_corresponding":true,"raw_author_name":"Qiao Pan","raw_affiliation_strings":["School of Computer Science and Technology, Donghua University,Shanghai,China"],"affiliations":[{"raw_affiliation_string":"School of Computer Science and Technology, Donghua University,Shanghai,China","institution_ids":["https://openalex.org/I181326427"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5113743722","display_name":"Long Zhu","orcid":null},"institutions":[{"id":"https://openalex.org/I181326427","display_name":"Donghua University","ror":"https://ror.org/035psfh38","country_code":"CN","type":"education","lineage":["https://openalex.org/I181326427"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Long Zhu","raw_affiliation_strings":["School of Computer Science and Technology, Donghua University,Shanghai,China"],"affiliations":[{"raw_affiliation_string":"School of Computer Science and Technology, Donghua University,Shanghai,China","institution_ids":["https://openalex.org/I181326427"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5108618690","display_name":"Zhouruixing Wang","orcid":"https://orcid.org/0009-0009-6764-5122"},"institutions":[{"id":"https://openalex.org/I181326427","display_name":"Donghua University","ror":"https://ror.org/035psfh38","country_code":"CN","type":"education","lineage":["https://openalex.org/I181326427"]}],"countries":["CN"],"is_corresponding":false,"raw_author_name":"Zhaoju Wang","raw_affiliation_strings":["School of Computer Science and Technology, Donghua University,Shanghai,China"],"affiliations":[{"raw_affiliation_string":"School of Computer Science and Technology, Donghua University,Shanghai,China","institution_ids":["https://openalex.org/I181326427"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5108681526"],"corresponding_institution_ids":["https://openalex.org/I181326427"],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.41928856,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"1","last_page":"8"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T11326","display_name":"Stock Market Forecasting Methods","score":0.18619999289512634,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T11326","display_name":"Stock Market Forecasting Methods","score":0.18619999289512634,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T11413","display_name":"Risk and Portfolio Optimization","score":0.11339999735355377,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10067","display_name":"Stochastic processes and financial applications","score":0.05590000003576279,"subfield":{"id":"https://openalex.org/subfields/2003","display_name":"Finance"},"field":{"id":"https://openalex.org/fields/20","display_name":"Economics, Econometrics and Finance"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7135999798774719},{"id":"https://openalex.org/keywords/quantile-regression","display_name":"Quantile regression","score":0.6272000074386597},{"id":"https://openalex.org/keywords/volatility","display_name":"Volatility (finance)","score":0.4902999997138977},{"id":"https://openalex.org/keywords/randomness","display_name":"Randomness","score":0.44339999556541443},{"id":"https://openalex.org/keywords/robustness","display_name":"Robustness (evolution)","score":0.39660000801086426},{"id":"https://openalex.org/keywords/risk-management","display_name":"Risk management","score":0.35740000009536743},{"id":"https://openalex.org/keywords/q-learning","display_name":"Q-learning","score":0.33090001344680786}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7135999798774719},{"id":"https://openalex.org/C63817138","wikidata":"https://www.wikidata.org/wiki/Q3455889","display_name":"Quantile regression","level":2,"score":0.6272000074386597},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.49140000343322754},{"id":"https://openalex.org/C91602232","wikidata":"https://www.wikidata.org/wiki/Q756115","display_name":"Volatility (finance)","level":2,"score":0.4902999997138977},{"id":"https://openalex.org/C125112378","wikidata":"https://www.wikidata.org/wiki/Q176640","display_name":"Randomness","level":2,"score":0.44339999556541443},{"id":"https://openalex.org/C63479239","wikidata":"https://www.wikidata.org/wiki/Q7353546","display_name":"Robustness (evolution)","level":3,"score":0.39660000801086426},{"id":"https://openalex.org/C149782125","wikidata":"https://www.wikidata.org/wiki/Q160039","display_name":"Econometrics","level":1,"score":0.39250001311302185},{"id":"https://openalex.org/C32896092","wikidata":"https://www.wikidata.org/wiki/Q189447","display_name":"Risk management","level":2,"score":0.35740000009536743},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.33320000767707825},{"id":"https://openalex.org/C188116033","wikidata":"https://www.wikidata.org/wiki/Q2664563","display_name":"Q-learning","level":3,"score":0.33090001344680786},{"id":"https://openalex.org/C94128290","wikidata":"https://www.wikidata.org/wiki/Q963287","display_name":"Value at risk","level":3,"score":0.3285999894142151},{"id":"https://openalex.org/C75949130","wikidata":"https://www.wikidata.org/wiki/Q848010","display_name":"Database transaction","level":2,"score":0.29580000042915344},{"id":"https://openalex.org/C93373587","wikidata":"https://www.wikidata.org/wiki/Q335632","display_name":"Mathematical finance","level":2,"score":0.2784999907016754},{"id":"https://openalex.org/C7149132","wikidata":"https://www.wikidata.org/wiki/Q1377840","display_name":"Forgetting","level":2,"score":0.2782000005245209},{"id":"https://openalex.org/C162324750","wikidata":"https://www.wikidata.org/wiki/Q8134","display_name":"Economics","level":0,"score":0.2734000086784363},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.2635999917984009},{"id":"https://openalex.org/C76178495","wikidata":"https://www.wikidata.org/wiki/Q4808784","display_name":"Asset (computer security)","level":2,"score":0.258899986743927},{"id":"https://openalex.org/C137912672","wikidata":"https://www.wikidata.org/wiki/Q1967096","display_name":"Possibility theory","level":4,"score":0.2578999996185303},{"id":"https://openalex.org/C118671147","wikidata":"https://www.wikidata.org/wiki/Q578714","display_name":"Quantile","level":2,"score":0.25529998540878296}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/ijcnn64981.2025.11228590","is_oa":false,"landing_page_url":"https://doi.org/10.1109/ijcnn64981.2025.11228590","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2025 International Joint Conference on Neural Networks (IJCNN)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":12,"referenced_works":["https://openalex.org/W2064978316","https://openalex.org/W2077791698","https://openalex.org/W2146612430","https://openalex.org/W2161836471","https://openalex.org/W2914584772","https://openalex.org/W3018556014","https://openalex.org/W3083887855","https://openalex.org/W3121491670","https://openalex.org/W3164154208","https://openalex.org/W4206472168","https://openalex.org/W4308605751","https://openalex.org/W4362722548"],"related_works":[],"abstract_inverted_index":{"In":[0,51],"the":[1,31,46,71,94,135,145,151,163,178,191,204,208,215,235,245,252,261,290],"financial":[2],"field,":[3],"options":[4],"hedging":[5,23,28,64,75,103,121,146,192,216,280,287],"has":[6,57],"gained":[7],"significant":[8],"attention":[9],"due":[10,39],"to":[11,40,133,176,195,213,249,258],"its":[12],"crucial":[13],"role":[14],"in":[15,36,62,109,138,203,266],"risk":[16,142,229],"management":[17],"and":[18,45,73,106,125,148,162,169,185,227,281,289,294,299],"corporate":[19],"operations.":[20],"Traditional":[21],"option":[22,63,120],"methods,":[24],"such":[25,92],"as":[26,93],"delta":[27],"based":[29,77],"on":[30,78],"Black-Scholes":[32],"model,":[33],"face":[34],"limitations":[35],"practical":[37],"application":[38],"assumptions":[41],"of":[42,48,96,102,144,150,182,224,237,263],"constant":[43],"volatility":[44],"neglect":[47,95],"transaction":[49],"costs.":[50],"recent":[52],"years,":[53],"reinforcement":[54,116,283],"learning":[55,117,127,254,284],"(RL)":[56],"become":[58],"a":[59,115,221,240],"hot":[60],"topic":[61],"research":[65],"because":[66],"it":[67,87],"can":[68],"interact":[69],"with":[70,128],"environment":[72],"adjust":[74],"strategies":[76],"environmental":[79],"feedback,":[80],"better":[81],"reflecting":[82],"real":[83],"market":[84,98,155,196],"conditions.":[85],"However,":[86],"still":[88],"faces":[89],"several":[90],"challenges,":[91],"historical":[97,129,139,154,183],"information,":[99],"insufficient":[100],"evaluation":[101,223],"cost":[104,217],"distributions,":[105],"high":[107,264],"randomness":[108,265],"model":[110],"training.":[111,268],"This":[112,219],"paper":[113],"proposes":[114],"method":[118,243,275],"for":[119,244],"using":[122],"quantile":[123,199],"regression":[124,200],"curriculum":[126,238],"data":[130],"fusion,":[131],"aiming":[132],"address":[134],"current":[136,187],"shortcomings":[137],"information":[140,156,184],"utilization,":[141],"assessment":[143],"strategy,":[147],"robustness":[149,298],"model.":[152],"Firstly,":[153],"is":[157,201,247],"incorporated":[158],"into":[159],"state":[160],"variables,":[161],"time-trend":[164],"multi-head":[165],"self-attention":[166],"mechanism":[167],"(TiTrMHSA)":[168],"Gated":[170],"Recurrent":[171],"Units":[172],"(GRU)":[173],"are":[174],"introduced":[175],"capture":[177],"dynamic":[179],"changing":[180],"trends":[181],"integrate":[186],"features,":[188],"significantly":[189,276],"improving":[190],"strategy\u2019s":[193],"sensitivity":[194],"fluctuations.":[197],"Secondly,":[198],"used":[202],"value":[205],"network,":[206],"combining":[207],"Quantile":[209],"Huber":[210],"Loss":[211],"function":[212],"fit":[214],"distribution.":[218],"enables":[220],"comprehensive":[222],"strategy":[225],"performance":[226],"enhances":[228],"control":[230],"capabilities.":[231],"Finally,":[232],"by":[233],"incorporating":[234],"concept":[236],"learning,":[239],"two-stage":[241],"training":[242],"agent":[246],"designed":[248],"progressively":[250],"optimize":[251],"agent\u2019s":[253],"process":[255],"from":[256],"simple":[257],"complex,":[259],"addressing":[260],"issue":[262],"early-stage":[267],"The":[269],"Experimental":[270],"results":[271],"show":[272],"that":[273],"this":[274],"outperforms":[277],"traditional":[278],"BS-Delta":[279],"other":[282],"models":[285],"regarding":[286],"costs":[288],"balance":[291],"between":[292],"returns":[293],"risks,":[295],"demonstrating":[296],"superior":[297],"adaptability.":[300]},"counts_by_year":[],"updated_date":"2026-03-07T16:01:11.037858","created_date":"2025-11-14T00:00:00"}