{"id":"https://openalex.org/W2052250648","doi":"https://doi.org/10.1109/slt.2014.7078575","title":"Bayesian recurrent neural network language model","display_name":"Bayesian recurrent neural network language model","publication_year":2014,"publication_date":"2014-12-01","ids":{"openalex":"https://openalex.org/W2052250648","doi":"https://doi.org/10.1109/slt.2014.7078575","mag":"2052250648"},"language":"en","primary_location":{"id":"doi:10.1109/slt.2014.7078575","is_oa":false,"landing_page_url":"https://doi.org/10.1109/slt.2014.7078575","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2014 IEEE Spoken Language Technology Workshop (SLT)","raw_type":"proceedings-article"},"type":"conference-paper","indexed_in":["crossref"],"open_access":{"is_oa":false,"oa_status":"closed","oa_url":null,"any_repository_has_fulltext":false},"authorships":[{"author_position":"first","author":{"id":"https://openalex.org/A5061908942","display_name":"Jen\u2010Tzung Chien","orcid":"https://orcid.org/0000-0003-3466-8941"},"institutions":[{"id":"https://openalex.org/I148366613","display_name":"National Yang Ming Chiao Tung University","ror":"https://ror.org/00se2k293","country_code":"TW","type":"education","lineage":["https://openalex.org/I148366613"]}],"countries":["TW"],"is_corresponding":false,"raw_author_name":"Jen-Tzung Chien","raw_affiliation_strings":["Department of Electrical and Computer Engineering, National Chiao Tung University, Taiwan","Department of Electrical and Computer Engineering, National Chiao Tung University,Taiwan"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Department of Electrical and Computer Engineering, National Chiao Tung University, Taiwan","institution_ids":["https://openalex.org/I148366613"]},{"raw_affiliation_string":"Department of Electrical and Computer Engineering, National Chiao Tung University,Taiwan","institution_ids":["https://openalex.org/I148366613"]}]},{"author_position":"last","author":{"id":"https://openalex.org/A5051163609","display_name":"Yuan-Chu Ku","orcid":null},"institutions":[{"id":"https://openalex.org/I148366613","display_name":"National Yang Ming Chiao Tung University","ror":"https://ror.org/00se2k293","country_code":"TW","type":"education","lineage":["https://openalex.org/I148366613"]}],"countries":["TW"],"is_corresponding":false,"raw_author_name":"Yuan-Chu Ku","raw_affiliation_strings":["Department of Electrical and Computer Engineering, National Chiao Tung University, Taiwan","Department of Electrical and Computer Engineering, National Chiao Tung University,Taiwan"],"raw_orcid":null,"affiliations":[{"raw_affiliation_string":"Department of Electrical and Computer Engineering, National Chiao Tung University, Taiwan","institution_ids":["https://openalex.org/I148366613"]},{"raw_affiliation_string":"Department of Electrical and Computer Engineering, National Chiao Tung University,Taiwan","institution_ids":["https://openalex.org/I148366613"]}]}],"institutions":[],"countries_distinct_count":1,"institutions_distinct_count":1,"corresponding_author_ids":[],"corresponding_institution_ids":["https://openalex.org/I148366613"],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":9,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":"3","issue":null,"first_page":"206","last_page":"211"},"is_retracted":false,"is_paratext":false,"is_xpac":false,"primary_topic":{"id":"https://openalex.org/T10201","display_name":"Speech Recognition and Synthesis","score":0.9991999864578247,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T10201","display_name":"Speech Recognition and Synthesis","score":0.9991999864578247,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10181","display_name":"Natural Language Processing Techniques","score":0.9957000017166138,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T10028","display_name":"Topic Modeling","score":0.9697999954223633,"subfield":{"id":"https://openalex.org/subfields/1702","display_name":"Artificial Intelligence"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/recurrent-neural-network","display_name":"Recurrent neural network","score":0.7854101657867432},{"id":"https://openalex.org/keywords/hyperparameter","display_name":"Hyperparameter","score":0.7542684078216553},{"id":"https://openalex.org/keywords/hessian-matrix","display_name":"Hessian matrix","score":0.6528645753860474},{"id":"https://openalex.org/keywords/maximum-a-posteriori-estimation","display_name":"Maximum a posteriori estimation","score":0.6527819633483887},{"id":"https://openalex.org/keywords/artificial-intelligence","display_name":"Artificial intelligence","score":0.591027021408081},{"id":"https://openalex.org/keywords/computer-science","display_name":"Computer science","score":0.5634996891021729},{"id":"https://openalex.org/keywords/marginal-likelihood","display_name":"Marginal likelihood","score":0.5574477314949036},{"id":"https://openalex.org/keywords/bayesian-probability","display_name":"Bayesian probability","score":0.5065463781356812},{"id":"https://openalex.org/keywords/maxima-and-minima","display_name":"Maxima and minima","score":0.504083514213562},{"id":"https://openalex.org/keywords/gaussian","display_name":"Gaussian","score":0.49231278896331787},{"id":"https://openalex.org/keywords/gaussian-process","display_name":"Gaussian process","score":0.46800652146339417},{"id":"https://openalex.org/keywords/language-model","display_name":"Language model","score":0.4378373622894287},{"id":"https://openalex.org/keywords/principle-of-maximum-entropy","display_name":"Principle of maximum entropy","score":0.4370802640914917},{"id":"https://openalex.org/keywords/a-priori-and-a-posteriori","display_name":"A priori and a posteriori","score":0.43452948331832886},{"id":"https://openalex.org/keywords/pattern-recognition","display_name":"Pattern recognition (psychology)","score":0.41757458448410034},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.3678395748138428},{"id":"https://openalex.org/keywords/machine-learning","display_name":"Machine learning","score":0.3608943521976471},{"id":"https://openalex.org/keywords/mathematics","display_name":"Mathematics","score":0.34078100323677063},{"id":"https://openalex.org/keywords/applied-mathematics","display_name":"Applied mathematics","score":0.22343230247497559},{"id":"https://openalex.org/keywords/statistics","display_name":"Statistics","score":0.13618090748786926},{"id":"https://openalex.org/keywords/maximum-likelihood","display_name":"Maximum likelihood","score":0.09979349374771118}],"concepts":[{"id":"https://openalex.org/C147168706","wikidata":"https://www.wikidata.org/wiki/Q1457734","display_name":"Recurrent neural network","level":3,"score":0.7854101657867432},{"id":"https://openalex.org/C8642999","wikidata":"https://www.wikidata.org/wiki/Q4171168","display_name":"Hyperparameter","level":2,"score":0.7542684078216553},{"id":"https://openalex.org/C203616005","wikidata":"https://www.wikidata.org/wiki/Q620495","display_name":"Hessian matrix","level":2,"score":0.6528645753860474},{"id":"https://openalex.org/C9810830","wikidata":"https://www.wikidata.org/wiki/Q635384","display_name":"Maximum a posteriori estimation","level":3,"score":0.6527819633483887},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.591027021408081},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5634996891021729},{"id":"https://openalex.org/C95923904","wikidata":"https://www.wikidata.org/wiki/Q6760420","display_name":"Marginal likelihood","level":3,"score":0.5574477314949036},{"id":"https://openalex.org/C107673813","wikidata":"https://www.wikidata.org/wiki/Q812534","display_name":"Bayesian probability","level":2,"score":0.5065463781356812},{"id":"https://openalex.org/C186633575","wikidata":"https://www.wikidata.org/wiki/Q845060","display_name":"Maxima and minima","level":2,"score":0.504083514213562},{"id":"https://openalex.org/C163716315","wikidata":"https://www.wikidata.org/wiki/Q901177","display_name":"Gaussian","level":2,"score":0.49231278896331787},{"id":"https://openalex.org/C61326573","wikidata":"https://www.wikidata.org/wiki/Q1496376","display_name":"Gaussian process","level":3,"score":0.46800652146339417},{"id":"https://openalex.org/C137293760","wikidata":"https://www.wikidata.org/wiki/Q3621696","display_name":"Language model","level":2,"score":0.4378373622894287},{"id":"https://openalex.org/C9679016","wikidata":"https://www.wikidata.org/wiki/Q1417473","display_name":"Principle of maximum entropy","level":2,"score":0.4370802640914917},{"id":"https://openalex.org/C75553542","wikidata":"https://www.wikidata.org/wiki/Q178161","display_name":"A priori and a posteriori","level":2,"score":0.43452948331832886},{"id":"https://openalex.org/C153180895","wikidata":"https://www.wikidata.org/wiki/Q7148389","display_name":"Pattern recognition (psychology)","level":2,"score":0.41757458448410034},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.3678395748138428},{"id":"https://openalex.org/C119857082","wikidata":"https://www.wikidata.org/wiki/Q2539","display_name":"Machine learning","level":1,"score":0.3608943521976471},{"id":"https://openalex.org/C33923547","wikidata":"https://www.wikidata.org/wiki/Q395","display_name":"Mathematics","level":0,"score":0.34078100323677063},{"id":"https://openalex.org/C28826006","wikidata":"https://www.wikidata.org/wiki/Q33521","display_name":"Applied mathematics","level":1,"score":0.22343230247497559},{"id":"https://openalex.org/C105795698","wikidata":"https://www.wikidata.org/wiki/Q12483","display_name":"Statistics","level":1,"score":0.13618090748786926},{"id":"https://openalex.org/C49781872","wikidata":"https://www.wikidata.org/wiki/Q1045555","display_name":"Maximum likelihood","level":2,"score":0.09979349374771118},{"id":"https://openalex.org/C134306372","wikidata":"https://www.wikidata.org/wiki/Q7754","display_name":"Mathematical analysis","level":1,"score":0.0},{"id":"https://openalex.org/C138885662","wikidata":"https://www.wikidata.org/wiki/Q5891","display_name":"Philosophy","level":0,"score":0.0},{"id":"https://openalex.org/C121332964","wikidata":"https://www.wikidata.org/wiki/Q413","display_name":"Physics","level":0,"score":0.0},{"id":"https://openalex.org/C111472728","wikidata":"https://www.wikidata.org/wiki/Q9471","display_name":"Epistemology","level":1,"score":0.0},{"id":"https://openalex.org/C62520636","wikidata":"https://www.wikidata.org/wiki/Q944","display_name":"Quantum mechanics","level":1,"score":0.0}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.1109/slt.2014.7078575","is_oa":false,"landing_page_url":"https://doi.org/10.1109/slt.2014.7078575","pdf_url":null,"source":null,"license":null,"license_id":null,"version":"publishedVersion","is_accepted":true,"is_published":true,"raw_source_name":"2014 IEEE Spoken Language Technology Workshop (SLT)","raw_type":"proceedings-article"}],"best_oa_location":null,"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":14,"referenced_works":["https://openalex.org/W174610329","https://openalex.org/W1524333225","https://openalex.org/W1631260214","https://openalex.org/W1934041838","https://openalex.org/W2009086942","https://openalex.org/W2111051539","https://openalex.org/W2158195707","https://openalex.org/W2474824677","https://openalex.org/W2998704965","https://openalex.org/W4285719527","https://openalex.org/W6631362777","https://openalex.org/W6636811518","https://openalex.org/W6680532216","https://openalex.org/W6720877245"],"related_works":["https://openalex.org/W4379933543","https://openalex.org/W2751326998","https://openalex.org/W4309133645","https://openalex.org/W2127712380","https://openalex.org/W2011109505","https://openalex.org/W2215490352","https://openalex.org/W251497191","https://openalex.org/W2186952403","https://openalex.org/W1986206777","https://openalex.org/W4250456475"],"abstract_inverted_index":{"This":[0],"paper":[1],"presents":[2],"a":[3,38,73,97],"Bayesian":[4,45],"approach":[5],"to":[6,21,70,90,105],"construct":[7],"the":[8,23,27,30,51,66,71,79,84],"recurrent":[9],"neural":[10],"network":[11],"language":[12],"model":[13,32,59,113],"(RNN-LM)":[14],"for":[15,108],"speech":[16],"recognition.":[17],"Our":[18],"idea":[19],"is":[20,35,48,60,93],"regularize":[22],"RNN-LM":[24],"by":[25,37,64,82,95,123],"compensating":[26],"uncertainty":[28],"of":[29,100,129],"estimated":[31],"parameters":[33,68],"which":[34],"represented":[36],"Gaussian":[39,80],"prior.":[40],"The":[41,57],"objective":[42],"function":[43],"in":[44],"RNN":[46],"(BRNN)":[47],"formed":[49],"as":[50],"regularized":[52,58,67],"cross":[53],"entropy":[54],"error":[55],"function.":[56],"not":[61],"only":[62],"constructed":[63],"training":[65,130],"according":[69],"maximum":[72],"posteriori":[74],"criterion":[75],"but":[76],"also":[77],"estimating":[78],"hyperparameter":[81],"maximizing":[83],"marginal":[85],"likelihood.":[86],"A":[87],"rapid":[88],"approximation":[89],"Hessian":[91],"matrix":[92],"developed":[94],"selecting":[96],"small":[98],"set":[99],"salient":[101],"outer-products":[102],"and":[103],"illustrated":[104],"be":[106],"effective":[107],"BRNN-LM.":[109],"BRNN-LM":[110,125],"achieves":[111],"sparser":[112],"than":[114],"RNN-LM.":[115],"Experiments":[116],"on":[117],"different":[118,127],"corpora":[119],"show":[120],"promising":[121],"improvement":[122],"applying":[124],"using":[126],"amount":[128],"data.":[131]},"counts_by_year":[{"year":2022,"cited_by_count":2},{"year":2019,"cited_by_count":1},{"year":2016,"cited_by_count":1},{"year":2015,"cited_by_count":5}],"updated_date":"2026-07-14T23:27:15.235271","created_date":"2025-10-10T00:00:00"}