{"id":"https://openalex.org/W4416374871","doi":"https://doi.org/10.48550/arxiv.2503.22712","title":"Coverage-Guaranteed Speech Emotion Recognition via Calibrated Uncertainty-Adaptive Prediction Sets","display_name":"Coverage-Guaranteed Speech Emotion Recognition via Calibrated Uncertainty-Adaptive Prediction Sets","publication_year":2025,"publication_date":"2025-03-24","ids":{"openalex":"https://openalex.org/W4416374871","doi":"https://doi.org/10.48550/arxiv.2503.22712"},"language":"en","primary_location":{"id":"pmh:oai:arXiv.org:2503.22712","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2503.22712","pdf_url":"https://arxiv.org/pdf/2503.22712","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},"type":"preprint","indexed_in":["arxiv","datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://arxiv.org/pdf/2503.22712","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5103044283","display_name":"Zijun Jia","orcid":"https://orcid.org/0009-0005-7192-2592"},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Jia, Zijun","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":"https://openalex.org/A5108695352","display_name":"Jinsong Yu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Yu, Jinsong","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":null,"display_name":"Long, Hongyu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Long, Hongyu","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":"https://openalex.org/A5023760637","display_name":"Diyin Tang","orcid":"https://orcid.org/0000-0001-5002-9694"},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Tang, Diyin","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":4,"corresponding_author_ids":["https://openalex.org/A5103044283"],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10667","display_name":"Emotion and Mood Recognition","score":0.9470999836921692,"subfield":{"id":"https://openalex.org/subfields/3205","display_name":"Experimental and Cognitive Psychology"},"field":{"id":"https://openalex.org/fields/32","display_name":"Psychology"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},"topics":[{"id":"https://openalex.org/T10667","display_name":"Emotion and Mood Recognition","score":0.9470999836921692,"subfield":{"id":"https://openalex.org/subfields/3205","display_name":"Experimental and Cognitive Psychology"},"field":{"id":"https://openalex.org/fields/32","display_name":"Psychology"},"domain":{"id":"https://openalex.org/domains/2","display_name":"Social Sciences"}},{"id":"https://openalex.org/T10664","display_name":"Sentiment Analysis and Opinion Mining","score":0.008299999870359898,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11309","display_name":"Music and Audio Processing","score":0.004999999888241291,"subfield":{"id":"https://openalex.org/subfields/1711","display_name":"Signal Processing"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/robustness","display_name":"Robustness (evolution)","score":0.7067000269889832},{"id":"https://openalex.org/keywords/generalizability-theory","display_name":"Generalizability theory","score":0.694100022315979},{"id":"https://openalex.org/keywords/hidden-markov-model","display_name":"Hidden Markov model","score":0.510699987411499},{"id":"https://openalex.org/keywords/bounded-function","display_name":"Bounded function","score":0.43459999561309814},{"id":"https://openalex.org/keywords/benchmark","display_name":"Benchmark (surveying)","score":0.4277999997138977},{"id":"https://openalex.org/keywords/binary-number","display_name":"Binary number","score":0.4253999888896942},{"id":"https://openalex.org/keywords/set","display_name":"Set (abstract data type)","score":0.3889999985694885},{"id":"https://openalex.org/keywords/calibration","display_name":"Calibration","score":0.3521000146865845},{"id":"https://openalex.org/keywords/markov-process","display_name":"Markov process","score":0.3431999981403351}],"concepts":[{"id":"https://openalex.org/C63479239","wikidata":"https://www.wikidata.org/wiki/Q7353546","display_name":"Robustness (evolution)","level":3,"score":0.7067000269889832},{"id":"https://openalex.org/C27158222","wikidata":"https://www.wikidata.org/wiki/Q5532422","display_name":"Generalizability theory","level":2,"score":0.694100022315979},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.6462000012397766},{"id":"https://openalex.org/C23224414","wikidata":"https://www.wikidata.org/wiki/Q176769","display_name":"Hidden Markov model","level":2,"score":0.510699987411499},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.4620000123977661},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.45730000734329224},{"id":"https://openalex.org/C34388435","wikidata":"https://www.wikidata.org/wiki/Q2267362","display_name":"Bounded function","level":2,"score":0.43459999561309814},{"id":"https://openalex.org/C185798385","wikidata":"https://www.wikidata.org/wiki/Q1161707","display_name":"Benchmark (surveying)","level":2,"score":0.4277999997138977},{"id":"https://openalex.org/C48372109","wikidata":"https://www.wikidata.org/wiki/Q3913","display_name":"Binary number","level":2,"score":0.4253999888896942},{"id":"https://openalex.org/C177264268","wikidata":"https://www.wikidata.org/wiki/Q1514741","display_name":"Set (abstract data type)","level":2,"score":0.3889999985694885},{"id":"https://openalex.org/C165838908","wikidata":"https://www.wikidata.org/wiki/Q736777","display_name":"Calibration","level":2,"score":0.3521000146865845},{"id":"https://openalex.org/C159886148","wikidata":"https://www.wikidata.org/wiki/Q176645","display_name":"Markov process","level":2,"score":0.3431999981403351},{"id":"https://openalex.org/C774472","wikidata":"https://www.wikidata.org/wiki/Q6760393","display_name":"Margin (machine learning)","level":2,"score":0.34299999475479126},{"id":"https://openalex.org/C28490314","wikidata":"https://www.wikidata.org/wiki/Q189436","display_name":"Speech recognition","level":1,"score":0.34200000762939453},{"id":"https://openalex.org/C12725497","wikidata":"https://www.wikidata.org/wiki/Q810247","display_name":"Baseline (sea)","level":2,"score":0.34119999408721924},{"id":"https://openalex.org/C188198153","wikidata":"https://www.wikidata.org/wiki/Q1613840","display_name":"Limiting","level":2,"score":0.33239999413490295},{"id":"https://openalex.org/C153180895","wikidata":"https://www.wikidata.org/wiki/Q7148389","display_name":"Pattern recognition (psychology)","level":2,"score":0.32910001277923584},{"id":"https://openalex.org/C124101348","wikidata":"https://www.wikidata.org/wiki/Q172491","display_name":"Data mining","level":1,"score":0.3190000057220459},{"id":"https://openalex.org/C14036430","wikidata":"https://www.wikidata.org/wiki/Q3736076","display_name":"Function (biology)","level":2,"score":0.31859999895095825},{"id":"https://openalex.org/C66905080","wikidata":"https://www.wikidata.org/wiki/Q17005494","display_name":"Binary classification","level":3,"score":0.31769999861717224},{"id":"https://openalex.org/C83282275","wikidata":"https://www.wikidata.org/wiki/Q7435350","display_name":"Scoring algorithm","level":2,"score":0.30889999866485596},{"id":"https://openalex.org/C163836022","wikidata":"https://www.wikidata.org/wiki/Q6771326","display_name":"Markov model","level":3,"score":0.30489999055862427},{"id":"https://openalex.org/C49937458","wikidata":"https://www.wikidata.org/wiki/Q2599292","display_name":"Probabilistic logic","level":2,"score":0.2992999851703644},{"id":"https://openalex.org/C48406656","wikidata":"https://www.wikidata.org/wiki/Q534112","display_name":"Martingale (probability theory)","level":2,"score":0.29600000381469727},{"id":"https://openalex.org/C169903167","wikidata":"https://www.wikidata.org/wiki/Q3985153","display_name":"Test set","level":2,"score":0.29409998655319214},{"id":"https://openalex.org/C45804977","wikidata":"https://www.wikidata.org/wiki/Q7239673","display_name":"Predictive modelling","level":2,"score":0.29260000586509705},{"id":"https://openalex.org/C2780801425","wikidata":"https://www.wikidata.org/wiki/Q5164392","display_name":"Construct (python library)","level":2,"score":0.2922999858856201},{"id":"https://openalex.org/C87007009","wikidata":"https://www.wikidata.org/wiki/Q210832","display_name":"Statistical hypothesis testing","level":2,"score":0.2752000093460083},{"id":"https://openalex.org/C58489278","wikidata":"https://www.wikidata.org/wiki/Q1172284","display_name":"Data set","level":2,"score":0.26570001244544983},{"id":"https://openalex.org/C114289077","wikidata":"https://www.wikidata.org/wiki/Q3284399","display_name":"Statistical model","level":2,"score":0.26489999890327454}],"mesh":[],"locations_count":2,"locations":[{"id":"pmh:oai:arXiv.org:2503.22712","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2503.22712","pdf_url":"https://arxiv.org/pdf/2503.22712","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},{"id":"doi:10.48550/arxiv.2503.22712","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2503.22712","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article"}],"best_oa_location":{"id":"pmh:oai:arXiv.org:2503.22712","is_oa":true,"landing_page_url":"http://arxiv.org/abs/2503.22712","pdf_url":"https://arxiv.org/pdf/2503.22712","source":{"id":"https://openalex.org/S4393918464","display_name":"ArXiv.org","issn_l":"2331-8422","issn":["2331-8422"],"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":null,"host_organization_name":null,"host_organization_lineage":[],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"text"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"grobid_xml":false,"pdf":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Road":[0],"rage,":[1],"often":[2],"triggered":[3],"by":[4,14,28,123],"emotional":[5],"suppression":[6],"and":[7,17,33,49,61,134,164,197],"sudden":[8],"outbursts,":[9],"significantly":[10],"threatens":[11],"road":[12],"safety":[13],"causing":[15],"collisions":[16],"aggressive":[18],"behavior.":[19],"Speech":[20],"emotion":[21],"recognition":[22],"technologies":[23],"can":[24],"mitigate":[25],"this":[26],"risk":[27,126],"identifying":[29],"negative":[30],"emotions":[31],"early":[32],"issuing":[34],"timely":[35],"alerts.":[36],"However,":[37],"current":[38],"SER":[39],"methods,":[40],"such":[41],"as":[42],"those":[43],"based":[44],"on":[45,79],"hidden":[46],"markov":[47],"models":[48,133],"Long":[50],"short-term":[51],"memory":[52],"networks,":[53],"primarily":[54],"handle":[55],"one-dimensional":[56],"signals,":[57],"frequently":[58],"experience":[59],"overfitting,":[60],"lack":[62],"calibration,":[63],"limiting":[64],"their":[65],"safety-critical":[66],"effectiveness.":[67],"We":[68,184],"propose":[69],"a":[70,85,90,106,112,124,143,180,186],"novel":[71],"risk-controlled":[72],"prediction":[73,80,103,192],"framework":[74,140,168],"providing":[75],"statistically":[76],"rigorous":[77],"guarantees":[78,210],"accuracy.":[81],"This":[82],"approach":[83],"employs":[84],"calibration":[86,178],"set":[87],"to":[88,116,175,190,206],"define":[89],"binary":[91],"loss":[92,114,121],"function":[93,115],"indicating":[94],"whether":[95],"the":[96,102,167],"true":[97],"label":[98],"is":[99],"included":[100],"in":[101,195,211],"set.":[104],"Using":[105],"data-driven":[107],"threshold":[108],"$\u03b2$,":[109],"we":[110],"optimize":[111],"joint":[113],"maintain":[117,191],"an":[118,173],"expected":[119],"test":[120,188],"bounded":[122],"user-specified":[125],"level":[127],"$\u03b1$.":[128],"Evaluations":[129],"across":[130],"six":[131],"baseline":[132],"two":[135],"benchmark":[136],"datasets":[137],"demonstrate":[138],"our":[139,203],"consistently":[141],"achieves":[142],"minimum":[144],"coverage":[145],"of":[146,166],"$1":[147],"-":[148],"\u03b1$,":[149],"effectively":[150],"controlling":[151],"marginal":[152],"error":[153],"rates":[154],"despite":[155],"varying":[156],"calibration-test":[157],"split":[158],"ratios":[159],"(e.g.,":[160],"0.1).":[161],"The":[162],"robustness":[163],"generalizability":[165],"are":[169],"further":[170],"validated":[171],"through":[172],"extension":[174],"small-batch":[176],"online":[177],"under":[179],"local":[181],"exchangeability":[182],"assumption.":[183],"construct":[185],"non-negative":[187],"martingale":[189],"validity":[193],"even":[194],"dynamic":[196],"non-exchangeable":[198],"environments.":[199],"Cross-dataset":[200],"tests":[201],"confirm":[202],"method's":[204],"ability":[205],"uphold":[207],"reliable":[208],"statistical":[209],"realistic,":[212],"evolving":[213],"data":[214],"scenarios.":[215]},"counts_by_year":[],"updated_date":"2026-04-21T08:09:41.155169","created_date":"2025-10-10T00:00:00"}