基于短文本理解的用户兴趣情感建模研究
随着网络的发展和智能设备的普及,人们越来越多地在网络中发表自己的言论和观点,因而产生海量的用户生成信息(User Generated Content,UGC).如何对UGC中短文本信息进行挖掘有着重要的研究意义.现有研究工作对用户的兴趣和情感分析基本都分开的,而实际中用户兴趣和情感是存在关联的.本文以短文本作为数据源,以用户为主体,进行兴趣建模和情感分析,寻找用户兴趣和情感的关联,构建用户兴趣情感模型.本文的研究内容主要包括:1)在基于内容的兴趣建模方面,针对短文本分析时传统方法存在不足,本文使用Twitter-LDA模型对用户兴趣进行分析,并结合用户兴趣的波动性和时间性,加入时间因子,构建用户兴趣模型;接着基于词向量方法构建用户兴趣知识树;然后提出基于逐点相似距离模型和词向量的兴趣相似计算方法(V-PSD),实现用户兴趣到知识树的映射以及兴趣度相似的计算.2)对短文本进行情感分析时,考虑用户兴趣因素对情感的影响,提出融合主题上下文和长短期记忆模型(LSTM)的短文本情感分类方法(T-CLSTM),构建用户兴趣情感模型.3)为更好地刻画用户情感,在文本情感分析时,引入心理学PAD概念,对情感进行量化分析,然后提出基于PAD情感模型的用户个性化的生成过程.通过对上述内容的实验分析,验证了用户兴趣和情感的关联关系,包括主题特征对情感分类的促进作用,以及兴趣结合PAD情感量化分析的有效性.
- 作者:
- 黄超
- 学位授予单位:
- 安徽工业大学
- 专业名称:
- 计算机科学与技术
- 授予学位:
- 硕士
- 学位年度:
- 2017年
- 导师姓名:
- 秦锋
- 中图分类号:
- TP391.1
- 关键词:
- 短文本理解;用户兴趣;情感分析;情感建模
- Short text understanding; User interest; Sentiment analysis; Sentiment modeling