{"id":"https://openalex.org/W2889094138","doi":"https://doi.org/10.18653/v1/d18-1165","title":"Learning a Policy for Opportunistic Active Learning","display_name":"Learning a Policy for Opportunistic Active Learning","publication_year":2018,"publication_date":"2018-01-01","ids":{"openalex":"https://openalex.org/W2889094138","doi":"https://doi.org/10.18653/v1/d18-1165","mag":"2889094138"},"language":"en","primary_location":{"id":"doi:10.18653/v1/d18-1165","is_oa":true,"landing_page_url":"https://doi.org/10.18653/v1/d18-1165","pdf_url":"https://www.aclweb.org/anthology/D18-1165.pdf","source":null,"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":true,"oa_status":"gold","oa_url":"https://www.aclweb.org/anthology/D18-1165.pdf","any_repository_has_fulltext":null},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5041020656","display_name":"Aishwarya Padmakumar","orcid":null},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":true,"raw_author_name":"Aishwarya Padmakumar","raw_affiliation_strings":["Department of Computer Science University of Texas at Austin"],"affiliations":[{"raw_affiliation_string":"Department of Computer Science University of Texas at Austin","institution_ids":["https://openalex.org/I86519309"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5001594330","display_name":"Peter Stone","orcid":"https://orcid.org/0000-0002-6795-420X"},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Peter Stone","raw_affiliation_strings":["Department of Computer Science University of Texas at Austin"],"affiliations":[{"raw_affiliation_string":"Department of Computer Science University of Texas at Austin","institution_ids":["https://openalex.org/I86519309"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5008715111","display_name":"Raymond J. Mooney","orcid":"https://orcid.org/0000-0002-4504-0490"},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Raymond Mooney","raw_affiliation_strings":["Department of Computer Science University of Texas at Austin"],"affiliations":[{"raw_affiliation_string":"Department of Computer Science University of Texas at Austin","institution_ids":["https://openalex.org/I86519309"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5041020656"],"corresponding_institution_ids":["https://openalex.org/I86519309"],"apc_list":null,"apc_paid":null,"fwci":1.8585,"has_fulltext":true,"cited_by_count":17,"citation_normalized_percentile":{"value":0.89146714,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":90,"max":98},"biblio":{"volume":null,"issue":null,"first_page":"1347","last_page":"1357"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T12072","display_name":"Machine Learning and Algorithms","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12072","display_name":"Machine Learning and Algorithms","score":0.9998999834060669,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11269","display_name":"Algorithms and Data Compression","score":0.9894000291824341,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.9873999953269958,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.8383445143699646},{"id":"https://openalex.org/keywords/task","display_name":"Task (project management)","score":0.7279758453369141},{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.71773362159729},{"id":"https://openalex.org/keywords/active-learning","display_name":"Active learning (machine learning)","score":0.7005158066749573},{"id":"https://openalex.org/keywords/learning-object","display_name":"Learning object","score":0.5469619631767273},{"id":"https://openalex.org/keywords/object","display_name":"Object (grammar)","score":0.5389317870140076},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.5270899534225464},{"id":"https://openalex.org/keywords/policy-learning","display_name":"Policy learning","score":0.4894203245639801},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.4222526550292969},{"id":"https://openalex.org/keywords/engineering","display_name":"Engineering","score":0.05483916401863098}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.8383445143699646},{"id":"https://openalex.org/C2780451532","wikidata":"https://www.wikidata.org/wiki/Q759676","display_name":"Task (project management)","level":2,"score":0.7279758453369141},{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.71773362159729},{"id":"https://openalex.org/C77967617","wikidata":"https://www.wikidata.org/wiki/Q4677561","display_name":"Active learning (machine learning)","level":2,"score":0.7005158066749573},{"id":"https://openalex.org/C2779542340","wikidata":"https://www.wikidata.org/wiki/Q1062461","display_name":"Learning object","level":2,"score":0.5469619631767273},{"id":"https://openalex.org/C2781238097","wikidata":"https://www.wikidata.org/wiki/Q175026","display_name":"Object (grammar)","level":2,"score":0.5389317870140076},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.5270899534225464},{"id":"https://openalex.org/C2779436431","wikidata":"https://www.wikidata.org/wiki/Q30672407","display_name":"Policy learning","level":2,"score":0.4894203245639801},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.4222526550292969},{"id":"https://openalex.org/C127413603","wikidata":"https://www.wikidata.org/wiki/Q11023","display_name":"Engineering","level":0,"score":0.05483916401863098},{"id":"https://openalex.org/C201995342","wikidata":"https://www.wikidata.org/wiki/Q682496","display_name":"Systems engineering","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.18653/v1/d18-1165","is_oa":true,"landing_page_url":"https://doi.org/10.18653/v1/d18-1165","pdf_url":"https://www.aclweb.org/anthology/D18-1165.pdf","source":null,"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing","raw_type":"proceedings-article"}],"best_oa_location":{"id":"doi:10.18653/v1/d18-1165","is_oa":true,"landing_page_url":"https://doi.org/10.18653/v1/d18-1165","pdf_url":"https://www.aclweb.org/anthology/D18-1165.pdf","source":null,"license":"cc-by","license_id":"https://openalex.org/licenses/cc-by","version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing","raw_type":"proceedings-article"},"sustainable_development_goals":[{"display_name":"Quality Education","id":"https://metadata.un.org/sdg/4","score":0.5600000023841858}],"awards":[{"id":"https://openalex.org/G1482799704","display_name":null,"funder_award_id":"IIS-1651089","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G187671969","display_name":null,"funder_award_id":"IIS-1637736","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G4174258917","display_name":"II-NEW:  Infrastructure for a Building-Wide Intelligence","funder_award_id":"1305287","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G4780449950","display_name":null,"funder_award_id":"CNS-1305287, IIS-1637736, IIS-1651089, IIS-1724157","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G5029475413","display_name":null,"funder_award_id":"IIS-1724157","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G6991911153","display_name":"EAGER: Human-Aware Navigation in Populated Indoor Environments","funder_award_id":"1651089","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G829377574","display_name":null,"funder_award_id":"1724157","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"},{"id":"https://openalex.org/G8653745736","display_name":"NRI: Robots that Learn to Communicate through Natural Human Dialog","funder_award_id":"1637736","funder_id":"https://openalex.org/F4320306076","funder_display_name":"National Science Foundation"}],"funders":[{"id":"https://openalex.org/F4320306076","display_name":"National Science Foundation","ror":"https://ror.org/021nxhr62"},{"id":"https://openalex.org/F4320308144","display_name":"Texas Department of Transportation","ror":"https://ror.org/02ky21x08"},{"id":"https://openalex.org/F4320310620","display_name":"University of Texas at Austin","ror":"https://ror.org/00hj54h04"}],"has_content":{"grobid_xml":true,"pdf":true},"content_urls":{"pdf":"https://content.openalex.org/works/W2889094138.pdf","grobid_xml":"https://content.openalex.org/works/W2889094138.grobid-xml"},"referenced_works_count":45,"referenced_works":["https://openalex.org/W22461475","https://openalex.org/W167321734","https://openalex.org/W1484084878","https://openalex.org/W1504412414","https://openalex.org/W1686810756","https://openalex.org/W1754243990","https://openalex.org/W1825604117","https://openalex.org/W1861993554","https://openalex.org/W1948566616","https://openalex.org/W2040123554","https://openalex.org/W2080021732","https://openalex.org/W2085989833","https://openalex.org/W2096715676","https://openalex.org/W2114663556","https://openalex.org/W2117539524","https://openalex.org/W2119970716","https://openalex.org/W2131797004","https://openalex.org/W2132847848","https://openalex.org/W2135733005","https://openalex.org/W2139821863","https://openalex.org/W2169863116","https://openalex.org/W2171671120","https://openalex.org/W2186554835","https://openalex.org/W2239330218","https://openalex.org/W2277195237","https://openalex.org/W2293407958","https://openalex.org/W2342049278","https://openalex.org/W2558809543","https://openalex.org/W2574893693","https://openalex.org/W2576920940","https://openalex.org/W2590833223","https://openalex.org/W2740275380","https://openalex.org/W2768661419","https://openalex.org/W2773391718","https://openalex.org/W2903158431","https://openalex.org/W2951025196","https://openalex.org/W2951911250","https://openalex.org/W2952013107","https://openalex.org/W2962883855","https://openalex.org/W2963367210","https://openalex.org/W2963696295","https://openalex.org/W3103120164","https://openalex.org/W4230563027","https://openalex.org/W4285719527","https://openalex.org/W4294526978"],"related_works":["https://openalex.org/W4306904969","https://openalex.org/W2138720691","https://openalex.org/W4362501864","https://openalex.org/W4380318855","https://openalex.org/W2031695474","https://openalex.org/W3084456289","https://openalex.org/W2024136090","https://openalex.org/W4391331176","https://openalex.org/W2586732548","https://openalex.org/W2124096728"],"abstract_inverted_index":{"Active":[0],"learning":[1,22,25,42,65],"identifies":[2],"data":[3],"points":[4],"to":[5,10,46,72],"label":[6],"that":[7,29,39,76,85],"are":[8],"expected":[9],"be":[11,44],"the":[12],"most":[13],"useful":[14],"in":[15,53],"improving":[16],"a":[17,74],"supervised":[18],"model.":[19],"Opportunistic":[20],"active":[21,24,41],"incorporates":[23],"into":[26],"interactive":[27,55],"tasks":[28],"constrain":[30],"possible":[31],"queries":[32],"during":[33],"interactions.":[34],"Prior":[35],"work":[36],"has":[37],"shown":[38],"opportunistic":[40],"can":[43],"used":[45],"improve":[47],"grounding":[48],"of":[49],"natural":[50],"language":[51],"descriptions":[52],"an":[54,68],"object":[56,69],"retrieval":[57,70],"task.":[58],"In":[59],"this":[60],"work,":[61],"we":[62],"use":[63],"reinforcement":[64],"for":[66],"such":[67],"task,":[71],"learn":[73],"policy":[75],"effectively":[77],"trades":[78],"off":[79],"task":[80],"completion":[81],"with":[82],"model":[83],"improvement":[84],"would":[86],"benefit":[87],"future":[88],"tasks.":[89]},"counts_by_year":[{"year":2025,"cited_by_count":1},{"year":2024,"cited_by_count":3},{"year":2022,"cited_by_count":2},{"year":2021,"cited_by_count":3},{"year":2020,"cited_by_count":6},{"year":2019,"cited_by_count":1},{"year":2018,"cited_by_count":1}],"updated_date":"2026-03-18T14:38:29.013473","created_date":"2025-10-10T00:00:00"}