{"id":"https://openalex.org/W2955241191","doi":"https://doi.org/10.1109/gcwkshps45667.2019.9024429","title":"A Reinforcement Learning Approach for the Multichannel Rendezvous Problem","display_name":"A Reinforcement Learning Approach for the Multichannel Rendezvous Problem","publication_year":2019,"publication_date":"2019-12-01","ids":{"openalex":"https://openalex.org/W2955241191","doi":"https://doi.org/10.1109/gcwkshps45667.2019.9024429","mag":"2955241191"},"language":"en","primary_location":{"id":"doi:10.1109/gcwkshps45667.2019.9024429","is_oa":false,"landing_page_url":"https://doi.org/10.1109/gcwkshps45667.2019.9024429","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2019 IEEE Globecom Workshops (GC Wkshps)","raw_type":"proceedings-article"},"type":"article","indexed_in":["arxiv","crossref"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://arxiv.org/pdf/1907.01919","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":null,"display_name":"Jen-Hung Wang","orcid":null},"institutions":[{"id":"https://openalex.org/I25846049","display_name":"National Tsing Hua University","ror":"https://ror.org/00zdnkx70","country_code":"TW","type":"education","lineage":["https://openalex.org/I25846049"]}],"countries":["TW"],"is_corresponding":true,"raw_author_name":"Jen-Hung Wang","raw_affiliation_strings":["Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C"],"affiliations":[{"raw_affiliation_string":"Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C","institution_ids":["https://openalex.org/I25846049"]}]},{"author_position":"middle","author":{"id":null,"display_name":"Ping-En Lu","orcid":null},"institutions":[{"id":"https://openalex.org/I25846049","display_name":"National Tsing Hua University","ror":"https://ror.org/00zdnkx70","country_code":"TW","type":"education","lineage":["https://openalex.org/I25846049"]}],"countries":["TW"],"is_corresponding":false,"raw_author_name":"Ping-En Lu","raw_affiliation_strings":["Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C"],"affiliations":[{"raw_affiliation_string":"Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C","institution_ids":["https://openalex.org/I25846049"]}]},{"author_position":"middle","author":{"id":null,"display_name":"Cheng-Shang Chang","orcid":null},"institutions":[{"id":"https://openalex.org/I25846049","display_name":"National Tsing Hua University","ror":"https://ror.org/00zdnkx70","country_code":"TW","type":"education","lineage":["https://openalex.org/I25846049"]}],"countries":["TW"],"is_corresponding":false,"raw_author_name":"Cheng-Shang Chang","raw_affiliation_strings":["Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C"],"affiliations":[{"raw_affiliation_string":"Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C","institution_ids":["https://openalex.org/I25846049"]}]},{"author_position":"last","author":{"id":null,"display_name":"Duan-Shin Lee","orcid":null},"institutions":[{"id":"https://openalex.org/I25846049","display_name":"National Tsing Hua University","ror":"https://ror.org/00zdnkx70","country_code":"TW","type":"education","lineage":["https://openalex.org/I25846049"]}],"countries":["TW"],"is_corresponding":false,"raw_author_name":"Duan-Shin Lee","raw_affiliation_strings":["Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C"],"affiliations":[{"raw_affiliation_string":"Institute of Communications Engineering, National Tsing Hua University, Hsinchu, Taiwan, R.O.C","institution_ids":["https://openalex.org/I25846049"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":4,"corresponding_author_ids":[],"corresponding_institution_ids":["https://openalex.org/I25846049"],"apc_list":null,"apc_paid":null,"fwci":0.7408,"has_fulltext":false,"cited_by_count":8,"citation_normalized_percentile":{"value":0.7413325,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":97},"biblio":{"volume":null,"issue":null,"first_page":"1","last_page":"5"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10579","display_name":"Cognitive Radio Networks and Spectrum Sensing","score":0.9998000264167786,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10579","display_name":"Cognitive Radio Networks and Spectrum Sensing","score":0.9998000264167786,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12101","display_name":"Advanced Bandit Algorithms Research","score":0.9997000098228455,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T12288","display_name":"Optimization and Search Problems","score":0.9980000257492065,"subfield":{"id":"https://openalex.org/subfields/1705","display_name":"Computer Networks and Communications"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/rendezvous","display_name":"Rendezvous","score":0.9620000123977661},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.8307999968528748},{"id":"https://openalex.org/keywords/channel","display_name":"Channel (broadcasting)","score":0.6733999848365784},{"id":"https://openalex.org/keywords/partially-observable-markov-decision-process","display_name":"Partially observable Markov decision process","score":0.6310999989509583},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.6100000143051147},{"id":"https://openalex.org/keywords/markov-chain","display_name":"Markov chain","score":0.5414999723434448},{"id":"https://openalex.org/keywords/markov-decision-process","display_name":"Markov decision process","score":0.5131999850273132},{"id":"https://openalex.org/keywords/cognitive-radio","display_name":"Cognitive radio","score":0.45570001006126404}],"concepts":[{"id":"https://openalex.org/C2779968344","wikidata":"https://www.wikidata.org/wiki/Q3932925","display_name":"Rendezvous","level":3,"score":0.9620000123977661},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.8307999968528748},{"id":"https://openalex.org/C127162648","wikidata":"https://www.wikidata.org/wiki/Q16858953","display_name":"Channel (broadcasting)","level":2,"score":0.6733999848365784},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6643000245094299},{"id":"https://openalex.org/C17098449","wikidata":"https://www.wikidata.org/wiki/Q176814","display_name":"Partially observable Markov decision process","level":4,"score":0.6310999989509583},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.6100000143051147},{"id":"https://openalex.org/C98763669","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov chain","level":2,"score":0.5414999723434448},{"id":"https://openalex.org/C106189395","wikidata":"https://www.wikidata.org/wiki/Q176789","display_name":"Markov decision process","level":3,"score":0.5131999850273132},{"id":"https://openalex.org/C149946192","wikidata":"https://www.wikidata.org/wiki/Q3235733","display_name":"Cognitive radio","level":3,"score":0.45570001006126404},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.42890000343322754},{"id":"https://openalex.org/C72434380","wikidata":"https://www.wikidata.org/wiki/Q230930","display_name":"State space","level":2,"score":0.42419999837875366},{"id":"https://openalex.org/C2777212361","wikidata":"https://www.wikidata.org/wiki/Q5127848","display_name":"Class (philosophy)","level":2,"score":0.4120999872684479},{"id":"https://openalex.org/C48103436","wikidata":"https://www.wikidata.org/wiki/Q599031","display_name":"State (computer science)","level":2,"score":0.39629998803138733},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.37779998779296875},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.3677999973297119},{"id":"https://openalex.org/C188116033","wikidata":"https://www.wikidata.org/wiki/Q2664563","display_name":"Q-learning","level":3,"score":0.364300012588501},{"id":"https://openalex.org/C81917197","wikidata":"https://www.wikidata.org/wiki/Q628760","display_name":"Selection (genetic algorithm)","level":2,"score":0.3443000018596649},{"id":"https://openalex.org/C123197309","wikidata":"https://www.wikidata.org/wiki/Q2882343","display_name":"Multi-armed bandit","level":3,"score":0.32659998536109924},{"id":"https://openalex.org/C32848918","wikidata":"https://www.wikidata.org/wiki/Q845789","display_name":"Observable","level":2,"score":0.31290000677108765},{"id":"https://openalex.org/C163836022","wikidata":"https://www.wikidata.org/wiki/Q6771326","display_name":"Markov model","level":3,"score":0.3050000071525574},{"id":"https://openalex.org/C149441793","wikidata":"https://www.wikidata.org/wiki/Q200726","display_name":"Probability distribution","level":2,"score":0.2971999943256378},{"id":"https://openalex.org/C177148314","wikidata":"https://www.wikidata.org/wiki/Q170084","display_name":"Generalization","level":2,"score":0.2842000126838684}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1109/gcwkshps45667.2019.9024429","is_oa":false,"landing_page_url":"https://doi.org/10.1109/gcwkshps45667.2019.9024429","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2019 IEEE Globecom Workshops (GC Wkshps)","raw_type":"proceedings-article"},{"id":"pmh:oai:arXiv.org:1907.01919","is_oa":true,"landing_page_url":"http://arxiv.org/abs/1907.01919","pdf_url":"https://arxiv.org/pdf/1907.01919","source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"}],"best_oa_location":{"id":"pmh:oai:arXiv.org:1907.01919","is_oa":true,"landing_page_url":"http://arxiv.org/abs/1907.01919","pdf_url":"https://arxiv.org/pdf/1907.01919","source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":16,"referenced_works":["https://openalex.org/W1966133801","https://openalex.org/W1990012830","https://openalex.org/W2077902449","https://openalex.org/W2078546978","https://openalex.org/W2125853208","https://openalex.org/W2142302990","https://openalex.org/W2153683377","https://openalex.org/W2170310212","https://openalex.org/W2745980399","https://openalex.org/W2747504495","https://openalex.org/W2898035736","https://openalex.org/W3147224201","https://openalex.org/W4254547512","https://openalex.org/W6628852983","https://openalex.org/W6669793766","https://openalex.org/W6765568544"],"related_works":[],"abstract_inverted_index":{"In":[0],"this":[1],"paper,":[2],"we":[3,68,123],"consider":[4],"the":[5,15,22,60,73,78,83,92,132,147,165],"multichannel":[6,65,115],"rendezvous":[7,28,66,88,116],"problem":[8,117],"in":[9,71,164],"cognitive":[10],"radio":[11],"networks":[12],"(CRNs)":[13],"where":[14],"probability":[16,104],"that":[17,44,146],"two":[18],"users":[19],"hopping":[20],"on":[21],"same":[23],"channel":[24,33,36,54,100,133],"have":[25,45],"a":[26,30,46,50,64,114,126],"successful":[27],"is":[29,151],"function":[31],"of":[32,85],"states.":[34],"The":[35],"states":[37,55],"are":[38,56,69],"modelled":[39],"by":[40,59],"two-state":[41],"Markov":[42],"chains":[43],"good":[47],"state":[48],"and":[49,154],"bad":[51],"state.":[52],"These":[53],"not":[57],"observable":[58],"users.":[61],"For":[62],"such":[63,113],"problem,":[67,122],"interested":[70],"finding":[72],"optimal":[74],"policy":[75],"to":[76,130,160],"minimize":[77],"expected":[79],"time-to-rendezvous":[80],"(ETTR)":[81],"among":[82],"class":[84],"dynamic":[86],"blind":[87],"policies,":[89],"i.e.,":[90],"at":[91],"t":[93],"th":[94],"time":[95],"slot":[96],"each":[97],"user":[98],"selects":[99],"i":[101,106,137],"independently":[102],"with":[103],"pi(t),":[105,136],"=":[107,138],"1,2,":[108,139],"...,":[109,140],"N.":[110,141],"By":[111],"formulating":[112],"as":[118],"an":[119],"adversarial":[120],"bandit":[121],"propose":[124],"using":[125],"reinforcement":[127,148],"learning":[128,149],"approach":[129,150],"learn":[131],"selection":[134],"probabilities":[135],"Our":[142],"experimental":[143],"results":[144],"show":[145],"very":[152],"effective":[153],"yields":[155],"comparable":[156],"ETTRs":[157],"when":[158],"comparing":[159],"various":[161],"approximation":[162],"policies":[163],"literature.":[166]},"counts_by_year":[{"year":2024,"cited_by_count":1},{"year":2023,"cited_by_count":3},{"year":2022,"cited_by_count":1},{"year":2021,"cited_by_count":2},{"year":2020,"cited_by_count":1}],"updated_date":"2026-03-07T16:01:11.037858","created_date":"2019-07-12T00:00:00"}