{"id":"https://openalex.org/W4312474362","doi":"https://doi.org/10.1145/3522664.3528609","title":"Engineering a platform for reinforcement learning workloads","display_name":"Engineering a platform for reinforcement learning workloads","publication_year":2022,"publication_date":"2022-05-16","ids":{"openalex":"https://openalex.org/W4312474362","doi":"https://doi.org/10.1145/3522664.3528609"},"language":"en","primary_location":{"id":"doi:10.1145/3522664.3528609","is_oa":false,"landing_page_url":"https://doi.org/10.1145/3522664.3528609","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 1st International Conference on AI Engineering: Software Engineering for AI","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5032519764","display_name":"Ali Kanso","orcid":"https://orcid.org/0000-0002-4366-841X"},"institutions":[{"id":"https://openalex.org/I4210164937","display_name":"Microsoft Research (United Kingdom)","ror":"https://ror.org/05k87vq12","country_code":"GB","type":"company","lineage":["https://openalex.org/I1290206253","https://openalex.org/I4210164937"]}],"countries":["GB"],"is_corresponding":true,"raw_author_name":"Ali Kanso","raw_affiliation_strings":["Microsoft"],"affiliations":[{"raw_affiliation_string":"Microsoft","institution_ids":["https://openalex.org/I4210164937"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5016338652","display_name":"Kinshuman Patra","orcid":null},"institutions":[{"id":"https://openalex.org/I4210164937","display_name":"Microsoft Research (United Kingdom)","ror":"https://ror.org/05k87vq12","country_code":"GB","type":"company","lineage":["https://openalex.org/I1290206253","https://openalex.org/I4210164937"]}],"countries":["GB"],"is_corresponding":false,"raw_author_name":"Kinshuman Patra","raw_affiliation_strings":["Microsoft"],"affiliations":[{"raw_affiliation_string":"Microsoft","institution_ids":["https://openalex.org/I4210164937"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":["https://openalex.org/A5032519764"],"corresponding_institution_ids":["https://openalex.org/I4210164937"],"apc_list":null,"apc_paid":null,"fwci":0.1326,"has_fulltext":false,"cited_by_count":1,"citation_normalized_percentile":{"value":0.54762694,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":90,"max":94},"biblio":{"volume":null,"issue":null,"first_page":"88","last_page":"89"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10639","display_name":"Advanced Software Engineering Methodologies","score":0.9190000295639038,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10639","display_name":"Advanced Software Engineering Methodologies","score":0.9190000295639038,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9168000221252441,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.9299307465553284},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7977865934371948},{"id":"https://openalex.org/keywords/scalability","display_name":"Scalability","score":0.7781156301498413},{"id":"https://openalex.org/keywords/reliability","display_name":"Reliability (semiconductor)","score":0.6320091485977173},{"id":"https://openalex.org/keywords/set","display_name":"Set (abstract data type)","score":0.5425518155097961},{"id":"https://openalex.org/keywords/state","display_name":"State (computer science)","score":0.5055453777313232},{"id":"https://openalex.org/keywords/distributed-computing","display_name":"Distributed computing","score":0.3939955532550812},{"id":"https://openalex.org/keywords/software-engineering","display_name":"Software engineering","score":0.3539804220199585},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.3382854759693146},{"id":"https://openalex.org/keywords/operating-system","display_name":"Operating system","score":0.17296725511550903},{"id":"https://openalex.org/keywords/programming-language","display_name":"Programming language","score":0.08143189549446106}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.9299307465553284},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7977865934371948},{"id":"https://openalex.org/C48044578","wikidata":"https://www.wikidata.org/wiki/Q727490","display_name":"Scalability","level":2,"score":0.7781156301498413},{"id":"https://openalex.org/C43214815","wikidata":"https://www.wikidata.org/wiki/Q7310987","display_name":"Reliability (semiconductor)","level":3,"score":0.6320091485977173},{"id":"https://openalex.org/C177264268","wikidata":"https://www.wikidata.org/wiki/Q1514741","display_name":"Set (abstract data type)","level":2,"score":0.5425518155097961},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.5055453777313232},{"id":"https://openalex.org/C120314980","wikidata":"https://www.wikidata.org/wiki/Q180634","display_name":"Distributed computing","level":1,"score":0.3939955532550812},{"id":"https://openalex.org/C115903868","wikidata":"https://www.wikidata.org/wiki/Q80993","display_name":"Software engineering","level":1,"score":0.3539804220199585},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.3382854759693146},{"id":"https://openalex.org/C111919701","wikidata":"https://www.wikidata.org/wiki/Q9135","display_name":"Operating system","level":1,"score":0.17296725511550903},{"id":"https://openalex.org/C199360897","wikidata":"https://www.wikidata.org/wiki/Q9143","display_name":"Programming language","level":1,"score":0.08143189549446106},{"id":"https://openalex.org/C163258240","wikidata":"https://www.wikidata.org/wiki/Q25342","display_name":"Power (physics)","level":2,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1145/3522664.3528609","is_oa":false,"landing_page_url":"https://doi.org/10.1145/3522664.3528609","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 1st International Conference on AI Engineering: Software Engineering for AI","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"score":0.41999998688697815,"display_name":"Industry, innovation and infrastructure","id":"https://metadata.un.org/sdg/9"}],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":["https://openalex.org/W2364921833","https://openalex.org/W2385146268","https://openalex.org/W1596201972","https://openalex.org/W1967954938","https://openalex.org/W1986253068","https://openalex.org/W2380023786","https://openalex.org/W2546696010","https://openalex.org/W2389719923","https://openalex.org/W2385763152","https://openalex.org/W2027487876"],"abstract_inverted_index":{"Reinforcement":[0,53],"Learning":[1,54],"(RL)":[2],"is":[3],"an":[4],"area":[5],"of":[6,67,94],"machine":[7],"learning":[8],"concerned":[9],"with":[10,58],"teaching":[11,23],"intelligent":[12],"agents":[13],"to":[14,38,40,47],"take":[15],"desired":[16,50],"actions":[17],"in":[18,28,45],"a":[19,29,49,56,65],"specific":[20],"environment.":[21],"The":[22],"part":[24],"can":[25,35],"be":[26],"performed":[27],"simulated":[30],"environment":[31],"where":[32],"the":[33,41,71,81,89,95],"agent":[34],"learn":[36],"how":[37],"react":[39],"(simulated)":[42],"current":[43],"state":[44],"order":[46],"reach":[48],"state.":[51],"Offering":[52],"as":[55],"service":[57],"stringent":[59],"reliability":[60],"and":[61,73,92],"scalability":[62],"requirements,":[63,90],"entails":[64],"set":[66],"challenges":[68],"at":[69],"both":[70],"architectural":[72],"implementation":[74,93],"level.":[75],"In":[76],"this":[77],"paper":[78],"we":[79],"present":[80],"Bonsai":[82,96],"platform":[83],"for":[84],"RL":[85],"workloads.":[86],"We":[87],"discuss":[88],"design":[91],"platform.":[97]},"counts_by_year":[{"year":2024,"cited_by_count":1}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}