{"id":"https://openalex.org/W2075754845","doi":"https://doi.org/10.1109/icassp.2014.6854659","title":"Estimating room acoustic parameters for speech recognizer adaptation and combination in reverberant environments","display_name":"Estimating room acoustic parameters for speech recognizer adaptation and combination in reverberant environments","publication_year":2014,"publication_date":"2014-05-01","ids":{"openalex":"https://openalex.org/W2075754845","doi":"https://doi.org/10.1109/icassp.2014.6854659","mag":"2075754845"},"language":"en","primary_location":{"id":"doi:10.1109/icassp.2014.6854659","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icassp.2014.6854659","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","raw_type":"proceedings-article"},"type":"article","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5011297325","display_name":"Feifei Xiong","orcid":"https://orcid.org/0000-0001-9783-2169"},"institutions":[{"id":"https://openalex.org/I4210138578","display_name":"Fraunhofer Institute for Digital Media Technology","ror":"https://ror.org/04gp0yb49","country_code":"DE","type":"facility","lineage":["https://openalex.org/I4210138578","https://openalex.org/I4923324"]}],"countries":["DE"],"is_corresponding":true,"raw_author_name":"Feifei Xiong","raw_affiliation_strings":["Fraunhofer Institute for Digital Media Technology IDMT, Project Group Hearing-, Speech- and Audio-Technology (HSA), 26129 Oldenburg, Germany","Fraunhofer Institute for Digital Media Technology (IDMT), Project group Hearing-, Speech- and Audio-Technology (HSA), 26129, Oldenburg, Germany"],"affiliations":[{"raw_affiliation_string":"Fraunhofer Institute for Digital Media Technology IDMT, Project Group Hearing-, Speech- and Audio-Technology (HSA), 26129 Oldenburg, Germany","institution_ids":["https://openalex.org/I4210138578"]},{"raw_affiliation_string":"Fraunhofer Institute for Digital Media Technology (IDMT), Project group Hearing-, Speech- and Audio-Technology (HSA), 26129, Oldenburg, Germany","institution_ids":["https://openalex.org/I4210138578"]}]},{"author_position":"middle","author":{"id":"https://openalex.org/A5027797344","display_name":"Stefan Goetze","orcid":"https://orcid.org/0000-0003-1044-7343"},"institutions":[{"id":"https://openalex.org/I4210138578","display_name":"Fraunhofer Institute for Digital Media Technology","ror":"https://ror.org/04gp0yb49","country_code":"DE","type":"facility","lineage":["https://openalex.org/I4210138578","https://openalex.org/I4923324"]}],"countries":["DE"],"is_corresponding":false,"raw_author_name":"Stefan Goetze","raw_affiliation_strings":["Fraunhofer Institute for Digital Media Technology IDMT, Project Group Hearing-, Speech- and Audio-Technology (HSA), 26129 Oldenburg, Germany","Fraunhofer Institute for Digital Media Technology (IDMT), Project group Hearing-, Speech- and Audio-Technology (HSA), 26129, Oldenburg, Germany"],"affiliations":[{"raw_affiliation_string":"Fraunhofer Institute for Digital Media Technology IDMT, Project Group Hearing-, Speech- and Audio-Technology (HSA), 26129 Oldenburg, Germany","institution_ids":["https://openalex.org/I4210138578"]},{"raw_affiliation_string":"Fraunhofer Institute for Digital Media Technology (IDMT), Project group Hearing-, Speech- and Audio-Technology (HSA), 26129, Oldenburg, Germany","institution_ids":["https://openalex.org/I4210138578"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5067491941","display_name":"Bernd T. Meyer","orcid":"https://orcid.org/0000-0001-9190-2111"},"institutions":[{"id":"https://openalex.org/I129877168","display_name":"Carl von Ossietzky Universit\u00e4t Oldenburg","ror":"https://ror.org/033n9gh91","country_code":"DE","type":"education","lineage":["https://openalex.org/I129877168"]}],"countries":["DE"],"is_corresponding":false,"raw_author_name":"Bernd T. Meyer","raw_affiliation_strings":["Dept. of Medical Physics and Acoustics, University of Oldenburg, 26111 Oldenburg, Germany"],"affiliations":[{"raw_affiliation_string":"Dept. of Medical Physics and Acoustics, University of Oldenburg, 26111 Oldenburg, Germany","institution_ids":["https://openalex.org/I129877168"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":3,"corresponding_author_ids":["https://openalex.org/A5011297325"],"corresponding_institution_ids":["https://openalex.org/I4210138578"],"apc_list":null,"apc_paid":null,"fwci":2.038,"has_fulltext":false,"cited_by_count":13,"citation_normalized_percentile":{"value":0.87466003,"is_in_top_1_percent":false,"is_in_top_10_percent":false},"cited_by_percentile_year":{"min":89,"max":97},"biblio":{"volume":"39","issue":null,"first_page":"5522","last_page":"5526"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10860","display_name":"Speech and Audio Processing","score":1.0,"subfield":{"id":"https://openalex.org/subfields/1711","display_name":"Signal Processing"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10860","display_name":"Speech and Audio Processing","score":1.0,"subfield":{"id":"https://openalex.org/subfields/1711","display_name":"Signal Processing"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10201","display_name":"Speech Recognition and Synthesis","score":0.9994000196456909,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11233","display_name":"Advanced Adaptive Filtering Techniques","score":0.9972000122070312,"subfield":{"id":"https://openalex.org/subfields/2206","display_name":"Computational Mechanics"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reverberation","display_name":"Reverberation","score":0.7992664575576782},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.7350286245346069},{"id":"https://openalex.org/keywords/speech-recognition","display_name":"Speech recognition","score":0.7282854318618774},{"id":"https://openalex.org/keywords/multilayer-perceptron","display_name":"Multilayer perceptron","score":0.5565120577812195},{"id":"https://openalex.org/keywords/focus","display_name":"Focus (optics)","score":0.5352189540863037},{"id":"https://openalex.org/keywords/word-error-rate","display_name":"Word error rate","score":0.52543044090271},{"id":"https://openalex.org/keywords/adaptation","display_name":"Adaptation (eye)","score":0.5094884037971497},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.39313292503356934},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.3898463845252991},{"id":"https://openalex.org/keywords/pattern-recognition","display_name":"Pattern recognition (psychology)","score":0.37164583802223206},{"id":"https://openalex.org/keywords/acoustics","display_name":"Acoustics","score":0.16489827632904053}],"concepts":[{"id":"https://openalex.org/C95851461","wikidata":"https://www.wikidata.org/wiki/Q468809","display_name":"Reverberation","level":2,"score":0.7992664575576782},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.7350286245346069},{"id":"https://openalex.org/C28490314","wikidata":"https://www.wikidata.org/wiki/Q189436","display_name":"Speech recognition","level":1,"score":0.7282854318618774},{"id":"https://openalex.org/C179717631","wikidata":"https://www.wikidata.org/wiki/Q2991667","display_name":"Multilayer perceptron","level":3,"score":0.5565120577812195},{"id":"https://openalex.org/C192209626","wikidata":"https://www.wikidata.org/wiki/Q190909","display_name":"Focus (optics)","level":2,"score":0.5352189540863037},{"id":"https://openalex.org/C40969351","wikidata":"https://www.wikidata.org/wiki/Q3516228","display_name":"Word error rate","level":2,"score":0.52543044090271},{"id":"https://openalex.org/C139807058","wikidata":"https://www.wikidata.org/wiki/Q352374","display_name":"Adaptation (eye)","level":2,"score":0.5094884037971497},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.39313292503356934},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.3898463845252991},{"id":"https://openalex.org/C153180895","wikidata":"https://www.wikidata.org/wiki/Q7148389","display_name":"Pattern recognition (psychology)","level":2,"score":0.37164583802223206},{"id":"https://openalex.org/C24890656","wikidata":"https://www.wikidata.org/wiki/Q82811","display_name":"Acoustics","level":1,"score":0.16489827632904053},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C120665830","wikidata":"https://www.wikidata.org/wiki/Q14620","display_name":"Optics","level":1,"score":0.0}],"mesh":[],"locations_count":2,"locations":[{"id":"doi:10.1109/icassp.2014.6854659","is_oa":false,"landing_page_url":"https://doi.org/10.1109/icassp.2014.6854659","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","raw_type":"proceedings-article"},{"id":"pmh:oai:publica.fraunhofer.de:publica/387154","is_oa":false,"landing_page_url":"https://publica.fraunhofer.de/handle/publica/387154","pdf_url":null,"source":{"id":"https://openalex.org/S4306400318","display_name":"Fraunhofer-Publica (Fraunhofer-Gesellschaft)","issn_l":null,"issn":null,"is_oa":false,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I4923324","host_organization_name":"Fraunhofer-Gesellschaft","host_organization_lineage":["https://openalex.org/I4923324"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":"submittedVersion","is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"conference paper"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":31,"referenced_works":["https://openalex.org/W102482883","https://openalex.org/W214395912","https://openalex.org/W1230632900","https://openalex.org/W1493817255","https://openalex.org/W1586170454","https://openalex.org/W1904457459","https://openalex.org/W1973669708","https://openalex.org/W1989314204","https://openalex.org/W1990934990","https://openalex.org/W1995400204","https://openalex.org/W2002342963","https://openalex.org/W2009106392","https://openalex.org/W2049633694","https://openalex.org/W2053967299","https://openalex.org/W2086286498","https://openalex.org/W2106718021","https://openalex.org/W2112059504","https://openalex.org/W2121981798","https://openalex.org/W2130722890","https://openalex.org/W2146871184","https://openalex.org/W2148898720","https://openalex.org/W2157019774","https://openalex.org/W2395140404","https://openalex.org/W2400523955","https://openalex.org/W2402003764","https://openalex.org/W2970850616","https://openalex.org/W4206633762","https://openalex.org/W6608656091","https://openalex.org/W6628167197","https://openalex.org/W6663848509","https://openalex.org/W6683228439"],"related_works":["https://openalex.org/W1656519308","https://openalex.org/W2042717753","https://openalex.org/W2022849831","https://openalex.org/W2037265366","https://openalex.org/W2026603686","https://openalex.org/W2331622705","https://openalex.org/W2391832549","https://openalex.org/W4401069787","https://openalex.org/W1499578372","https://openalex.org/W2368849850"],"abstract_inverted_index":{"This":[0],"work":[1],"analyzes":[2],"the":[3,23,60,71,121],"influence":[4],"of":[5,49,70,101,116],"reverberation":[6,29],"on":[7,22],"automatic":[8],"speech":[9],"recognition":[10],"(ASR)":[11],"systems":[12],"and":[13,35,87,111],"how":[14],"to":[15,58,75,125],"compensate":[16],"its":[17],"influence,":[18],"with":[19],"special":[20],"focus":[21],"important":[24],"acoustical":[25],"parameters":[26],"i.e.":[27],"room":[28],"time":[30],"T":[31],"<sub":[32,39],"xmlns:mml=\"http://www.w3.org/1998/Math/MathML\"":[33,40],"xmlns:xlink=\"http://www.w3.org/1999/xlink\">60</sub>":[34],"clarity":[36],"index":[37],"C":[38],"xmlns:xlink=\"http://www.w3.org/1999/xlink\">50</sub>":[41],".":[42],"A":[43,99],"multilayer":[44],"perceptron":[45],"(MLP)":[46],"using":[47],"features":[48],"a":[50,77,84],"spectro-temporal":[51],"filter":[52],"bank":[53],"as":[54],"input":[55],"is":[56,105,118],"employed":[57],"identify":[59],"acoustic":[61],"conditions":[62],"spanning":[63],"various":[64],"reverberant":[65],"scenarios.":[66],"The":[67],"posterior":[68],"probabilities":[69],"MLP":[72],"are":[73],"used":[74],"design":[76],"novel":[78],"selection":[79],"scheme":[80],"for":[81,88],"adaptation":[82],"in":[83],"cluster-based":[85],"manner":[86],"system":[89,123],"combination":[90],"achieved":[91],"by":[92,120],"recognizer":[93],"output":[94],"voting":[95],"error":[96,103],"reduction":[97],"(ROVER).":[98],"comparison":[100],"word":[102],"rates":[104],"performed":[106],"considering":[107],"different":[108],"training":[109],"modes,":[110],"an":[112],"average":[113],"relative":[114],"improvement":[115],"7.1%":[117],"obtained":[119],"proposed":[122],"compared":[124],"conventional":[126],"multistyle":[127],"training.":[128]},"counts_by_year":[{"year":2023,"cited_by_count":1},{"year":2022,"cited_by_count":1},{"year":2020,"cited_by_count":2},{"year":2018,"cited_by_count":2},{"year":2017,"cited_by_count":2},{"year":2016,"cited_by_count":2},{"year":2015,"cited_by_count":3}],"updated_date":"2025-11-06T03:46:38.306776","created_date":"2025-10-10T00:00:00"}