{"id":"https://openalex.org/W2993021567","doi":"https://doi.org/10.1109/allerton.2019.8919959","title":"Modeling and optimization of Human-Machine Interaction Processes via the Maximum Entropy Principle","display_name":"Modeling and optimization of Human-Machine Interaction Processes via the Maximum Entropy Principle","publication_year":2019,"publication_date":"2019-09-01","ids":{"openalex":"https://openalex.org/W2993021567","doi":"https://doi.org/10.1109/allerton.2019.8919959","mag":"2993021567"},"language":"en","primary_location":{"id":"doi:10.1109/allerton.2019.8919959","is_oa":false,"landing_page_url":"https://doi.org/10.1109/allerton.2019.8919959","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2019 57th Annual Allerton Conference on Communication, Control, and Computing (Allerton)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5018295450","display_name":"Jiaxiao Zheng","orcid":null},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":true,"raw_author_name":"Jiaxiao Zheng","raw_affiliation_strings":["The University of Texas at Austin,Department of Electrical and Computer Engineering,Austin,TX,78712","Department of Electrical and Computer Engineering, The University of Texas at Austin, Austin, TX"],"affiliations":[{"raw_affiliation_string":"The University of Texas at Austin,Department of Electrical and Computer Engineering,Austin,TX,78712","institution_ids":["https://openalex.org/I86519309"]},{"raw_affiliation_string":"Department of Electrical and Computer Engineering, The University of Texas at Austin, Austin, TX","institution_ids":["https://openalex.org/I86519309"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5008917819","display_name":"Gustavo de Veciana","orcid":"https://orcid.org/0000-0002-1498-494X"},"institutions":[{"id":"https://openalex.org/I86519309","display_name":"The University of Texas at Austin","ror":"https://ror.org/00hj54h04","country_code":"US","type":"education","lineage":["https://openalex.org/I86519309"]}],"countries":["US"],"is_corresponding":false,"raw_author_name":"Gustavo de Veciana","raw_affiliation_strings":["The University of Texas at Austin,Department of Electrical and Computer Engineering,Austin,TX,78712","Department of Electrical and Computer Engineering, The University of Texas at Austin, Austin, TX"],"affiliations":[{"raw_affiliation_string":"The University of Texas at Austin,Department of Electrical and Computer Engineering,Austin,TX,78712","institution_ids":["https://openalex.org/I86519309"]},{"raw_affiliation_string":"Department of Electrical and Computer Engineering, The University of Texas at Austin, Austin, TX","institution_ids":["https://openalex.org/I86519309"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":2,"corresponding_author_ids":["https://openalex.org/A5018295450"],"corresponding_institution_ids":["https://openalex.org/I86519309"],"apc_list":null,"apc_paid":null,"fwci":0.2886,"has_fulltext":false,"cited_by_count":2,"citation_normalized_percentile":{"value":0.68185859,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":94},"biblio":{"volume":"518","issue":null,"first_page":"824","last_page":"831"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9955000281333923,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10462","display_name":"Reinforcement Learning in Robotics","score":0.9955000281333923,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12101","display_name":"Advanced Bandit Algorithms Research","score":0.9944999814033508,"subfield":{"id":"https://openalex.org/subfields/1803","display_name":"Management Science and Operations Research"},"field":{"id":"https://openalex.org/fields/18","display_name":"Decision Sciences"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10603","display_name":"Smart Grid Energy Management","score":0.9711999893188477,"subfield":{"id":"https://openalex.org/subfields/2208","display_name":"Electrical and Electronic Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7615358829498291},{"id":"https://openalex.org/keywords/principle-of-maximum-entropy","display_name":"Principle of maximum entropy","score":0.5834358334541321},{"id":"https://openalex.org/keywords/entropy","display_name":"Entropy (arrow of time)","score":0.5625642538070679},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.56156986951828},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.538176953792572},{"id":"https://openalex.org/keywords/convergence","display_name":"Convergence (economics)","score":0.41338834166526794},{"id":"https://openalex.org/keywords/mathematical-optimization","display_name":"Mathematical optimization","score":0.3448970913887024},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.15403690934181213}],"concepts":[{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7615358829498291},{"id":"https://openalex.org/C9679016","wikidata":"https://www.wikidata.org/wiki/Q1417473","display_name":"Principle of maximum entropy","level":2,"score":0.5834358334541321},{"id":"https://openalex.org/C106301342","wikidata":"https://www.wikidata.org/wiki/Q4117933","display_name":"Entropy (arrow of time)","level":2,"score":0.5625642538070679},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.56156986951828},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.538176953792572},{"id":"https://openalex.org/C2777303404","wikidata":"https://www.wikidata.org/wiki/Q759757","display_name":"Convergence (economics)","level":2,"score":0.41338834166526794},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.3448970913887024},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.15403690934181213},{"id":"https://openalex.org/C162324750","wikidata":"https://www.wikidata.org/wiki/Q8134","display_name":"Economics","level":0,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0},{"id":"https://openalex.org/C50522688","wikidata":"https://www.wikidata.org/wiki/Q189833","display_name":"Economic growth","level":1,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/allerton.2019.8919959","is_oa":false,"landing_page_url":"https://doi.org/10.1109/allerton.2019.8919959","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2019 57th Annual Allerton Conference on Communication, Control, and Computing (Allerton)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[{"display_name":"Peace, Justice and strong institutions","id":"https://metadata.un.org/sdg/16","score":0.5199999809265137}],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":29,"referenced_works":["https://openalex.org/W534311","https://openalex.org/W368265031","https://openalex.org/W1770000304","https://openalex.org/W1993325457","https://openalex.org/W2049934117","https://openalex.org/W2051944318","https://openalex.org/W2098258765","https://openalex.org/W2098432798","https://openalex.org/W2107726111","https://openalex.org/W2108525416","https://openalex.org/W2108852225","https://openalex.org/W2117629901","https://openalex.org/W2119567691","https://openalex.org/W2136582516","https://openalex.org/W2137724033","https://openalex.org/W2145339207","https://openalex.org/W2171114620","https://openalex.org/W2334782222","https://openalex.org/W2950929549","https://openalex.org/W2963584844","https://openalex.org/W2993021567","https://openalex.org/W4214717370","https://openalex.org/W4237293291","https://openalex.org/W4294187414","https://openalex.org/W6674868663","https://openalex.org/W6674995601","https://openalex.org/W6676171483","https://openalex.org/W6679945570","https://openalex.org/W6685306887"],"related_works":["https://openalex.org/W1517908938","https://openalex.org/W2961085424","https://openalex.org/W3101314311","https://openalex.org/W4224009465","https://openalex.org/W2281834912","https://openalex.org/W1489941249","https://openalex.org/W4306674287","https://openalex.org/W3041490575","https://openalex.org/W2970690932","https://openalex.org/W2110715801"],"abstract_inverted_index":{"We":[0,166,179],"propose":[1,140],"a":[2,32,141],"data-driven":[3,90],"framework":[4],"to":[5,43,57,72,83,111],"enable":[6],"the":[7,65,68,73,79,104,114,120,133,146,157],"modeling":[8],"and":[9,27,55,61,118,155,174,177],"optimization":[10],"of":[11,67,76,171],"human-machine":[12],"interaction":[13,99],"processes,":[14,78],"e.g.,":[15],"systems":[16],"aimed":[17],"at":[18],"assisting":[19],"humans":[20],"in":[21,64,93,113,128,132,169],"decision-making":[22],"or":[23,45],"learning,":[24],"work-load":[25],"allocation,":[26],"interactive":[28,74],"advertising.":[29],"This":[30],"is":[31,41],"challenging":[33],"problem":[34],"for":[35,196],"several":[36],"reasons.":[37],"First,":[38],"humans'":[39],"behavior":[40,154],"hard":[42],"model":[44,195],"infer,":[46],"as":[47],"it":[48],"may":[49,87,126],"reflect":[50],"biases,":[51],"long":[52],"term":[53],"memory,":[54],"sensitivity":[56],"sequencing,":[58],"i.e.,":[59],"transience":[60],"exponential":[62],"complexity":[63,176],"length":[66],"interaction.":[69,134],"Second,":[70],"due":[71],"nature":[75],"such":[77],"machine":[80,95,158],"policy":[81],"used":[82],"engage":[84],"with":[85],"human":[86,116,130,153,197],"bias":[88],"possible":[89],"inferences.":[91],"Finally,":[92],"choosing":[94],"policies":[96],"that":[97],"optimize":[98],"rewards,":[100],"one":[101,105],"must,":[102],"on":[103,119,145,186],"hand,":[106],"avoid":[107],"being":[108,122],"overly":[109,123],"sensitive":[110],"error/variability":[112],"estimated":[115],"model,":[117],"other,":[121],"deterministic/predictable":[124],"which":[125,150],"result":[127],"poor":[129],"`engagement'":[131],"To":[135],"meet":[136],"these":[137],"challenges,":[138],"we":[139],"robust":[142],"approach,":[143],"based":[144,185],"maximum":[147],"entropy":[148],"principle,":[149],"iteratively":[151],"estimates":[152],"optimizes":[156],"policy,":[159],"namely":[160],"Alternating":[161],"Entropy-Reward":[162],"Ascent":[163],"(AREA)":[164],"algorithm.":[165],"characterize":[167],"AREA,":[168],"terms":[170],"its":[172],"space":[173],"time":[175],"convergence.":[178],"also":[180],"provide":[181],"an":[182,191],"initial":[183],"validation":[184],"synthetic":[187],"data":[188],"generated":[189],"by":[190],"established":[192],"noisy":[193],"nonlinear":[194],"decision-making.":[198]},"counts_by_year":[{"year":2020,"cited_by_count":1},{"year":2019,"cited_by_count":1}],"updated_date":"2026-04-02T13:48:15.688549","created_date":"2025-10-10T00:00:00"}