{"id":"https://openalex.org/W4416195077","doi":"https://doi.org/10.1145/3768292.3770396","title":"Learning to Scalp: A Reinforcement Learning Agent-Based Study","display_name":"Learning to Scalp: A Reinforcement Learning Agent-Based Study","publication_year":2025,"publication_date":"2025-11-14","ids":{"openalex":"https://openalex.org/W4416195077","doi":"https://doi.org/10.1145/3768292.3770396"},"language":"en","primary_location":{"id":"doi:10.1145/3768292.3770396","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3768292.3770396","pdf_url":null,"source":null,"license":"cc-by-nd","license_id":"https://openalex.org/licenses/cc-by-nd","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 6th ACM International Conference on AI in Finance","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"gold","oa_url":"https://doi.org/10.1145/3768292.3770396","any_repository_has_fulltext":null},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5120402006","display_name":"Sriram Bharadwaj Rangarajan","orcid":"https://orcid.org/0009-0006-4310-4004"},"institutions":[{"id":"https://openalex.org/I183935753","display_name":"King's College London","ror":"https://ror.org/0220mzb33","country_code":"GB","type":"education","lineage":["https://openalex.org/I124357947","https://openalex.org/I183935753"]}],"countries":["GB"],"is_corresponding":false,"raw_author_name":"Sriram Bharadwaj Rangarajan","raw_affiliation_strings":["UKRI Centre for Doctoral Training in Safe and Trusted AI, Department of Informatics, King's College London, London, United Kingdom"],"raw_orcid":"https://orcid.org/0009-0006-4310-4004","affiliations":[{"raw_affiliation_string":"UKRI Centre for Doctoral Training in Safe and Trusted AI, Department of Informatics, King's College London, London, United Kingdom","institution_ids":["https://openalex.org/I183935753"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5001328914","display_name":"Carmine Ventre","orcid":"https://orcid.org/0000-0003-1464-1215"},"institutions":[{"id":"https://openalex.org/I183935753","display_name":"King's College London","ror":"https://ror.org/0220mzb33","country_code":"GB","type":"education","lineage":["https://openalex.org/I124357947","https://openalex.org/I183935753"]}],"countries":["GB"],"is_corresponding":false,"raw_author_name":"Carmine Ventre","raw_affiliation_strings":["Department of Informatics, King's College London, London, United Kingdom"],"raw_orcid":"https://orcid.org/0000-0003-1464-1215","affiliations":[{"raw_affiliation_string":"Department of Informatics, King's College London, London, United Kingdom","institution_ids":["https://openalex.org/I183935753"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":0.0,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":{"value":0.38728412,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":"753","last_page":"761"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10047","display_name":"Financial Markets and Investment Strategies","score":0.4230000078678131,"subfield":{"id":"https://openalex.org/subfields/2003","display_name":"Finance"},"field":{"id":"https://openalex.org/fields/20","display_name":"Economics, Econometrics and Finance"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T10047","display_name":"Financial Markets and Investment Strategies","score":0.4230000078678131,"subfield":{"id":"https://openalex.org/subfields/2003","display_name":"Finance"},"field":{"id":"https://openalex.org/fields/20","display_name":"Economics, Econometrics and Finance"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T11270","display_name":"Complex Systems and Time Series Analysis","score":0.374099999666214,"subfield":{"id":"https://openalex.org/subfields/2002","display_name":"Economics and Econometrics"},"field":{"id":"https://openalex.org/fields/20","display_name":"Economics, Econometrics and Finance"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T11674","display_name":"Sports Analytics and Performance","score":0.041099999099969864,"subfield":{"id":"https://openalex.org/subfields/2002","display_name":"Economics and Econometrics"},"field":{"id":"https://openalex.org/fields/20","display_name":"Economics, Econometrics and Finance"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/counterfactual-thinking","display_name":"Counterfactual thinking","score":0.8641999959945679},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.7736999988555908},{"id":"https://openalex.org/keywords/predictability","display_name":"Predictability","score":0.7088000178337097},{"id":"https://openalex.org/keywords/order","display_name":"Order (exchange)","score":0.4943000078201294},{"id":"https://openalex.org/keywords/skew","display_name":"Skew","score":0.45660001039505005},{"id":"https://openalex.org/keywords/matching","display_name":"Matching (statistics)","score":0.3853999972343445},{"id":"https://openalex.org/keywords/algorithmic-trading","display_name":"Algorithmic trading","score":0.34209999442100525},{"id":"https://openalex.org/keywords/reinforcement","display_name":"Reinforcement","score":0.3321000039577484}],"concepts":[{"id":"https://openalex.org/C108650721","wikidata":"https://www.wikidata.org/wiki/Q1783253","display_name":"Counterfactual thinking","level":2,"score":0.8641999959945679},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.7736999988555908},{"id":"https://openalex.org/C197640229","wikidata":"https://www.wikidata.org/wiki/Q2534066","display_name":"Predictability","level":2,"score":0.7088000178337097},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6333000063896179},{"id":"https://openalex.org/C182306322","wikidata":"https://www.wikidata.org/wiki/Q1779371","display_name":"Order (exchange)","level":2,"score":0.4943000078201294},{"id":"https://openalex.org/C43711488","wikidata":"https://www.wikidata.org/wiki/Q7534783","display_name":"Skew","level":2,"score":0.45660001039505005},{"id":"https://openalex.org/C165064840","wikidata":"https://www.wikidata.org/wiki/Q1321061","display_name":"Matching (statistics)","level":2,"score":0.3853999972343445},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.36890000104904175},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.34470000863075256},{"id":"https://openalex.org/C78508483","wikidata":"https://www.wikidata.org/wiki/Q139445","display_name":"Algorithmic trading","level":2,"score":0.34209999442100525},{"id":"https://openalex.org/C67203356","wikidata":"https://www.wikidata.org/wiki/Q1321905","display_name":"Reinforcement","level":2,"score":0.3321000039577484},{"id":"https://openalex.org/C24683644","wikidata":"https://www.wikidata.org/wiki/Q138372","display_name":"High-frequency trading","level":3,"score":0.32820001244544983},{"id":"https://openalex.org/C120936955","wikidata":"https://www.wikidata.org/wiki/Q2155640","display_name":"Empirical research","level":2,"score":0.3093999922275543},{"id":"https://openalex.org/C131562839","wikidata":"https://www.wikidata.org/wiki/Q1574928","display_name":"Trading strategy","level":2,"score":0.30709999799728394},{"id":"https://openalex.org/C2775936607","wikidata":"https://www.wikidata.org/wiki/Q466845","display_name":"Tracking (education)","level":2,"score":0.30640000104904175},{"id":"https://openalex.org/C176777502","wikidata":"https://www.wikidata.org/wiki/Q4774623","display_name":"Anticipation (artificial intelligence)","level":2,"score":0.3046000003814697},{"id":"https://openalex.org/C42475967","wikidata":"https://www.wikidata.org/wiki/Q194292","display_name":"Operations research","level":1,"score":0.30250000953674316},{"id":"https://openalex.org/C111696304","wikidata":"https://www.wikidata.org/wiki/Q2303697","display_name":"Sorting","level":2,"score":0.30140000581741333},{"id":"https://openalex.org/C175444787","wikidata":"https://www.wikidata.org/wiki/Q39072","display_name":"Microeconomics","level":1,"score":0.27889999747276306},{"id":"https://openalex.org/C71889745","wikidata":"https://www.wikidata.org/wiki/Q1783264","display_name":"Counterfactual conditional","level":3,"score":0.27799999713897705},{"id":"https://openalex.org/C51926234","wikidata":"https://www.wikidata.org/wiki/Q3312426","display_name":"Market microstructure","level":3,"score":0.2721000015735626},{"id":"https://openalex.org/C103144560","wikidata":"https://www.wikidata.org/wiki/Q2670999","display_name":"Investment strategy","level":3,"score":0.27140000462532043},{"id":"https://openalex.org/C162324750","wikidata":"https://www.wikidata.org/wiki/Q8134","display_name":"Economics","level":0,"score":0.2549999952316284},{"id":"https://openalex.org/C2779662365","wikidata":"https://www.wikidata.org/wiki/Q5416694","display_name":"Event (particle physics)","level":2,"score":0.25060001015663147}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1145/3768292.3770396","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3768292.3770396","pdf_url":null,"source":null,"license":"cc-by-nd","license_id":"https://openalex.org/licenses/cc-by-nd","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 6th ACM International Conference on AI in Finance","raw_type":"proceedings-article"},{"id":"pmh:oai:kclpure.kcl.ac.uk:publications/e179296a-6e38-403a-b770-67d32d906c8a","is_oa":false,"landing_page_url":"https://kclpure.kcl.ac.uk/portal/en/publications/e179296a-6e38-403a-b770-67d32d906c8a","pdf_url":null,"source":{"id":"https://openalex.org/S4306400216","display_name":"Research Portal (King's College London)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I183935753","host_organization_name":"King's College London","host_organization_lineage":["https://openalex.org/I183935753"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":"Rangarajan, S B & Ventre, C 2025, Learning to Scalp: A Reinforcement Learning Agent-Based Study. in Proceedings of the 6th ACM International Conference on AI in Finance (ICAIF 2025).","raw_type":"contributionToPeriodical"}],"best_oa_location":{"id":"doi:10.1145/3768292.3770396","is_oa":true,"landing_page_url":"https://doi.org/10.1145/3768292.3770396","pdf_url":null,"source":null,"license":"cc-by-nd","license_id":"https://openalex.org/licenses/cc-by-nd","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 6th ACM International Conference on AI in Finance","raw_type":"proceedings-article"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":24,"referenced_works":["https://openalex.org/W80881613","https://openalex.org/W1482319751","https://openalex.org/W1976859468","https://openalex.org/W1988270113","https://openalex.org/W2001770658","https://openalex.org/W2007562804","https://openalex.org/W2018567859","https://openalex.org/W2032774582","https://openalex.org/W2057537221","https://openalex.org/W2123739530","https://openalex.org/W2162288466","https://openalex.org/W2588931397","https://openalex.org/W2687495032","https://openalex.org/W3023274588","https://openalex.org/W3033083249","https://openalex.org/W3092233902","https://openalex.org/W3122774084","https://openalex.org/W3124692056","https://openalex.org/W3125869920","https://openalex.org/W3196479566","https://openalex.org/W4236194914","https://openalex.org/W4306317483","https://openalex.org/W4404351593","https://openalex.org/W6944410474"],"related_works":[],"abstract_inverted_index":{"Institutional":[0],"traders":[1],"often":[2],"use":[3],"execution":[4,60,116,143,214],"strategies":[5,153,170],"such":[6],"as":[7,209],"Time-Weighted":[8],"Average":[9],"Price":[10],"(TWAP)":[11],"to":[12,37,50,66,76,79,109,126,154,185],"slice":[13],"up":[14],"large":[15],"trades":[16],"into":[17,193],"child":[18,30,131,159],"orders":[19,132,160],"and":[20,56,86,128,137,161,174,200],"thereby":[21,57],"minimise":[22],"market":[23,41,135,198],"impact.":[24],"However,":[25],"the":[26,29,52,70,80,87,111,120,148,156,168,179,194,202],"predictability":[27,157],"of":[28,72,82,113,122,150,158,182,204],"order":[31,54],"arrival":[32],"times":[33],"makes":[34],"them":[35],"susceptible":[36],"predatory":[38],"pricing":[39],"from":[40],"makers":[42],"(MM),":[43],"who":[44],"may":[45],"strategically":[46],"skew":[47],"their":[48],"quotes":[49],"\u2018scalp\u2019":[51],"incoming":[53,130],"flow":[55],"increase":[58],"TWAP":[59,152,175],"costs.":[61,117,144,164],"While":[62],"empirical":[63],"studies":[64],"attempt":[65],"test":[67],"this":[68,93],"hypothesis,":[69],"impact":[71,112],"scalping":[73,114],"is":[74],"hard":[75],"quantify":[77],"due":[78],"lack":[81],"a":[83,97,104,206,210],"reliable":[84],"counterfactual":[85],"necessary":[88],"data":[89],"being":[90],"proprietary.":[91],"In":[92],"paper,":[94],"we":[95,146],"train":[96],"reinforcement":[98],"learning":[99],"based":[100],"MM":[101,125,173],"agent":[102],"in":[103],"financial":[105],"agent-based":[106],"model":[107],"(ABM)":[108],"investigate":[110],"on":[115,142],"We":[118,165],"evaluate":[119],"ability":[121,149],"an":[123],"adaptive":[124],"predict":[127],"scalp":[129],"under":[133],"different":[134],"conditions,":[136],"its":[138],"corresponding":[139],"adverse":[140],"effect":[141],"Further,":[145],"demonstrate":[147],"randomized":[151],"reduce":[155],"mitigate":[162],"scalping-induced":[163],"then":[166],"study":[167,189],"equilibrium":[169],"adopted":[171],"by":[172,177],"agents":[176,184,199],"considering":[178],"best":[180],"responses":[181],"these":[183],"each":[186],"other.":[187],"Our":[188],"provides":[190],"novel":[191],"insights":[192],"strategic":[195],"interplay":[196],"between":[197],"demonstrates":[201],"importance":[203],"using":[205],"RL-ABM":[207],"framework":[208],"tool":[211],"for":[212],"robust":[213],"strategy":[215],"design.":[216]},"counts_by_year":[],"updated_date":"2026-06-11T09:08:48.828518","created_date":"2025-11-14T00:00:00"}