今天是:

通知公告

通知公告

当前位置: 本站首页 >> 通知公告 >> 正文

知识共享---学术系列之计算机系讲座(第四十九期)

发布日期:2018-10-08    作者:     来源:     点击:

--- LDA主题模型

LDA主题模型是一个非常经典的主题模型,它是一种非监督机器学习技术,可以用来识别大规模文档集(document collection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bag of words)的方法,这种方法将每一篇文档视为一个词频向量,从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序,这简化了问题的复杂性,同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。

10月9日(周二)中午12:30在图书馆一层学习共享空间,计算机系王英奎老师将为大家作“LDA主题模型”学术讲座。

欢迎有兴趣的老师和同学参加!