{"id":"https://openalex.org/W2911555067","doi":"https://doi.org/10.1109/bigdata.2018.8622264","title":"Scheduling Large-scale Distributed Training via Reinforcement Learning","display_name":"Scheduling Large-scale Distributed Training via Reinforcement Learning","publication_year":2018,"publication_date":"2018-12-01","ids":{"openalex":"https://openalex.org/W2911555067","doi":"https://doi.org/10.1109/bigdata.2018.8622264","mag":"2911555067"},"language":"en","primary_location":{"id":"doi:10.1109/bigdata.2018.8622264","is_oa":false,"landing_page_url":"https://doi.org/10.1109/bigdata.2018.8622264","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2018 IEEE International Conference on Big Data (Big Data)","raw_type":"proceedings-article"},"type":"conference-paper","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5067765750","display_name":"Zhanglin Peng","orcid":"https://orcid.org/0000-0002-1195-5895"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Zhanglin Peng","raw_affiliation_strings":["SenseTime Research"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"SenseTime Research","institution_ids":[]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5101092284","display_name":"Jiamin Ren","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Jiamin Ren","raw_affiliation_strings":["SenseTime Research"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"SenseTime Research","institution_ids":[]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5003608795","display_name":"Ruimao Zhang","orcid":"https://orcid.org/0000-0001-9511-7532"},"institutions":[{"id":"https://openalex.org/I177725633","display_name":"Chinese University of Hong Kong","ror":"https://ror.org/00t33hh48","country_code":"HK","type":"education","lineage":["https://openalex.org/I177725633"]}],"countries":["HK"],"is_corresponding":false,"raw_author_name":"Ruimao Zhang","raw_affiliation_strings":["The Chinese University of Hong Kong"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"The Chinese University of Hong Kong","institution_ids":["https://openalex.org/I177725633"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5042263308","display_name":"Ling\u2010Yun Wu","orcid":"https://orcid.org/0000-0001-9487-0215"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Lingyun Wu","raw_affiliation_strings":["SenseTime Research"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"SenseTime Research","institution_ids":[]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5059138390","display_name":"Xinjiang Wang","orcid":"https://orcid.org/0000-0002-7997-7564"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Xinjiang Wang","raw_affiliation_strings":["SenseTime Research"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"SenseTime Research","institution_ids":[]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5100752686","display_name":"Ping Luo","orcid":"https://orcid.org/0000-0002-6685-7950"},"institutions":[{"id":"https://openalex.org/I177725633","display_name":"Chinese University of Hong Kong","ror":"https://ror.org/00t33hh48","country_code":"HK","type":"education","lineage":["https://openalex.org/I177725633"]}],"countries":["HK"],"is_corresponding":false,"raw_author_name":"Ping Luo","raw_affiliation_strings":["The Chinese University of Hong Kong"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"The Chinese University of Hong Kong","institution_ids":["https://openalex.org/I177725633"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":"16","issue":null,"first_page":"1797","last_page":"1806"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10036","display_name":"Advanced Neural Network Applications","score":0.9988999962806702,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10036","display_name":"Advanced Neural Network Applications","score":0.9988999962806702,"subfield":{"id":"https://openalex.org/subfields/1707","display_name":"Computer Vision and Pattern Recognition"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11612","display_name":"Stochastic Gradient Optimization Techniques","score":0.9961000084877014,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11307","display_name":"Domain Adaptation and Few-Shot Learning","score":0.995199978351593,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.8767416477203369},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7993675470352173},{"id":"https://openalex.org/keywords/scheduling","display_name":"Scheduling (production processes)","score":0.6551694869995117},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.6378608345985413},{"id":"https://openalex.org/keywords/deep-neural-networks","display_name":"Deep neural networks","score":0.5529826879501343},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.524243175983429},{"id":"https://openalex.org/keywords/computation","display_name":"Computation","score":0.5230977535247803},{"id":"https://openalex.org/keywords/temporal-difference-learning","display_name":"Temporal difference learning","score":0.5182528495788574},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.4434260129928589},{"id":"https://openalex.org/keywords/piecewise","display_name":"Piecewise","score":0.42143136262893677},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.19449403882026672},{"id":"https://openalex.org/keywords/algorithm","display_name":"Algorithm","score":0.09269213676452637},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.0769934356212616}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.8767416477203369},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7993675470352173},{"id":"https://openalex.org/C206729178","wikidata":"https://www.wikidata.org/wiki/Q2271896","display_name":"Scheduling (production processes)","level":2,"score":0.6551694869995117},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.6378608345985413},{"id":"https://openalex.org/C2984842247","wikidata":"https://www.wikidata.org/wiki/Q197536","display_name":"Deep neural networks","level":3,"score":0.5529826879501343},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.524243175983429},{"id":"https://openalex.org/C45374587","wikidata":"https://www.wikidata.org/wiki/Q12525525","display_name":"Computation","level":2,"score":0.5230977535247803},{"id":"https://openalex.org/C196340769","wikidata":"https://www.wikidata.org/wiki/Q7698910","display_name":"Temporal difference learning","level":3,"score":0.5182528495788574},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.4434260129928589},{"id":"https://openalex.org/C164660894","wikidata":"https://www.wikidata.org/wiki/Q2037833","display_name":"Piecewise","level":2,"score":0.42143136262893677},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.19449403882026672},{"id":"https://openalex.org/C11413529","wikidata":"https://www.wikidata.org/wiki/Q8366","display_name":"Algorithm","level":1,"score":0.09269213676452637},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.0769934356212616},{"id":"https://openalex.org/C134306372","wikidata":"https://www.wikidata.org/wiki/Q7754","display_name":"Mathematical analysis","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/bigdata.2018.8622264","is_oa":false,"landing_page_url":"https://doi.org/10.1109/bigdata.2018.8622264","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2018 IEEE International Conference on Big Data (Big Data)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":55,"referenced_works":["https://openalex.org/W639708223","https://openalex.org/W1522301498","https://openalex.org/W1576445103","https://openalex.org/W1836465849","https://openalex.org/W1861492603","https://openalex.org/W2102605133","https://openalex.org/W2108598243","https://openalex.org/W2117539524","https://openalex.org/W2119717200","https://openalex.org/W2155893237","https://openalex.org/W2163605009","https://openalex.org/W2183341477","https://openalex.org/W2186615578","https://openalex.org/W2194775991","https://openalex.org/W2250384498","https://openalex.org/W2288122362","https://openalex.org/W2302255633","https://openalex.org/W2544860310","https://openalex.org/W2549139847","https://openalex.org/W2557728737","https://openalex.org/W2613718673","https://openalex.org/W2752331852","https://openalex.org/W2953384591","https://openalex.org/W2962746461","https://openalex.org/W2962843773","https://openalex.org/W2963263347","https://openalex.org/W2963587345","https://openalex.org/W2963703197","https://openalex.org/W2963775850","https://openalex.org/W2964054038","https://openalex.org/W2964121744","https://openalex.org/W2964294659","https://openalex.org/W2969945254","https://openalex.org/W3093116395","https://openalex.org/W3106250896","https://openalex.org/W3118608800","https://openalex.org/W4297778814","https://openalex.org/W4300687381","https://openalex.org/W6620707391","https://openalex.org/W6631190155","https://openalex.org/W6638667902","https://openalex.org/W6639102338","https://openalex.org/W6684191040","https://openalex.org/W6686509673","https://openalex.org/W6698183232","https://openalex.org/W6713134421","https://openalex.org/W6714477741","https://openalex.org/W6717367658","https://openalex.org/W6726497184","https://openalex.org/W6744046992","https://openalex.org/W6745728296","https://openalex.org/W6748057086","https://openalex.org/W6751037545","https://openalex.org/W6785652829","https://openalex.org/W6787972765"],"related_works":["https://openalex.org/W2145363145","https://openalex.org/W2341346307","https://openalex.org/W2154399718","https://openalex.org/W4321463377","https://openalex.org/W2768629321","https://openalex.org/W2130711276","https://openalex.org/W4308828368","https://openalex.org/W1528400370","https://openalex.org/W2152445738","https://openalex.org/W3038962357"],"abstract_inverted_index":{"Scheduling":[0],"the":[1,12,18,44,72,99,152],"training":[2],"procedure":[3],"of":[4,20,46,58,74,96,101,146],"deep":[5,21],"neural":[6],"networks":[7],"(DNNs)":[8],"such":[9,25,169],"as":[10,26,170],"tuning":[11],"learning":[13,30,75,129],"rates":[14],"is":[15,136],"crucial":[16],"to":[17,39,84,120,138],"successes":[19],"learning.":[22],"Previous":[23],"strategies":[24],"piecewise":[27],"and":[28,49,104,167,173],"exponential":[29],"rate":[31,76],"schedulers":[32],"have":[33],"different":[34],"arguments":[35,55,73],"(hyper-parameters)":[36],"that":[37,70,151],"need":[38],"be":[40],"tuned":[41],"manually.":[42],"With":[43],"expanding":[45],"data":[47],"scale":[48],"model":[50],"computation,":[51],"searching":[52],"for":[53,141],"these":[54,110],"spends":[56],"lots":[57],"empirical":[59],"efforts.":[60],"To":[61],"address":[62],"this":[63,65],"issue,":[64],"work":[66,163],"proposes":[67],"policy":[68,88,156],"schedular":[69,89,157],"determines":[71,109],"(lr)":[77],"by":[78,127],"reinforcement":[79],"learning,":[80],"significantly":[81],"reducing":[82],"costs":[83],"tune":[85],"them.":[86],"The":[87],"possesses":[90],"several":[91],"appealing":[92],"benefits.":[93],"First,":[94],"instead":[95],"manually":[97],"defining":[98],"values":[100,111],"initial":[102],"lr":[103,126,140],"ultimate":[105],"lr,":[106,122],"it":[107,123,135],"autonomously":[108],"in":[112],"training.":[113],"Second,":[114],"rather":[115],"than":[116],"using":[117],"predefined":[118],"functions":[119],"update":[121],"adaptively":[124],"oscillates":[125],"monitoring":[128],"curves":[130],"without":[131],"human":[132],"intervention.":[133],"Third,":[134],"able":[137],"select":[139],"each":[142],"block":[143],"or":[144],"layer":[145],"a":[147],"DNN.":[148],"Experiments":[149],"show":[150],"DNNs":[153],"trained":[154],"with":[155],"achieve":[158],"superior":[159],"performances,":[160],"outperforming":[161],"previous":[162],"on":[164],"various":[165],"tasks":[166],"benchmarks":[168],"ImageNet,":[171],"COCO,":[172],"learning-to-learn.":[174]},"counts_by_year":[],"updated_date":"2026-07-14T23:27:15.235271","created_date":"2025-10-10T00:00:00"}