【全球新视野】经典情感分析模型总结(上)
机器之心专栏
本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 3 期进行连载,共介绍 18个在推荐系统任务上曾取得 SOTA 的经典模型。
第 1 期:CNN、GRNN、CLSTM、TD-LSTM/TC-LSTM
(资料图片)
第 2 期:MemNet、AT-LSTM、IAN、AF-LSTM
第 3 期:Bert on ABSA、ASGCN、GAN、Sentic GCN
您正在阅读的是其中的第 1 期。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。
本期收录模型速览| 模型 | SOTA!模型资源站收录情况 | 模型来源论文 |
|---|---|---|
| CNN | https://sota.jiqizhixin.com/project/textcnn收录实现数量:6支持框架:PyTorch,TensorFlow等 | Convolutional Neural Networks for Sentence Classification |
| GRNN | https://sota.jiqizhixin.com/project/grnn-2 | Document modeling with gated recurrent neural network for sentiment classification |
| CLSTM | https://sota.jiqizhixin.com/project/clstm | Cached Long Short-Term Memory Neural Networks for Document-Level Sentiment Classification |
| TD-LSTM/TC-LSTM | https://sota.jiqizhixin.com/project/td-lstm-2收录实现数量:11支持框架:PyTorch,TensorFlow等 | Effective LSTMs for Target-Dependent Sentiment Classification |
情感分析(sentiment analysis)是指利用计算机技术对文本、图像、音频、视频甚至跨模态的数据进行情绪挖掘与分析。广义上讲,情感分析还包括对观点、态度、倾向的分析等。情感分析是自然语言处理的一个重要的研究领域。情感分析主要涉及两个对象,即评价的对象(包括商品、服务、组织、个体、话题、问题、事件等)和对该对象的态度、情感等。情感分析在社会的舆情管理、商业决策、精准营销等领域有着广泛的应用。从情感分析的数据来源角度看,可分为人脸情感分析、语音情感分析、肢体语言情感分析、文本情感分析和生理模式情感分析等,本文聚焦于文本的情感分析,这也是目前网络内容理解中使用的重要技术(如无特别说明,下文中提到的情感分析均为文本情感分析)。在自然语言处理中,情感分析属于典型的文本分类问题,即把需要进行情感分析的文本划分为其所属类别。主流的情感分析方法有两种:基于词典的方法和基于机器学习算法的方法。基于词典的方法主要通过制定一系列的情感词典和规则,拆解文本、提取关键词、计算情感值,最后通过情感值来作为文本的情感倾向判断依据。这种方法往往会忽略其词顺序、语法和句法,将这段文本仅仅看做是一个词集合,因此不能充分的表达文本语义信息。而引入深度学习技术的机器学习方法,利用词嵌入技术可以避免文字长短不均带来的处理困难;使用深度学习抽象特征,可以避免大量人工提取特征的工作;模拟词与词之间的联系,有局部特征抽象化和记忆功能,因此,深度学习技术在情感分析中发挥了越来越重要的作用。目前情感分析用到的深度学习神经网络有多层神经网络(MLP)、卷积神经网络(CNN)和长短期记忆模型(LSTM),具体不同的模型通过交叉验证技术选取最优参数(比如,几层模型、每层节点数、Dropout 概率等)。情感分析的模型主要分为三个层面,分别为:Document level、Sentence level和Aspect level。其中,Document level是将整个文本作为分析单元并假设该文本讨论的对象为单一实体且情感、观点都是鲜明、清晰的,即neural、positive or negative 。Sentence level则是以每个句子作为单独的分析对象,由于句子与句子间可能存在某些关联,因此我们不能将其认为是观点明确的。而对于Aspect level其分类粒度更细,即我们需要抽取出targets不同层面相互独立的评价,并进行总结综合得到最后的情感。本文回顾情感分析中必备的TOP模型。一些经典的自然语言处理领域的模型,例如XLNet、Bert及各种变体,适用于NLU、文本生成、情感分析等多个领域,本文均不涉及。本文只专注于专门的sentiment analysis模型。
一、Document level/Sentence level
1、 CNN
这篇文章引入卷积神经网络(CNN),将层与卷积滤波器应用于局部特征。最初发明用于计算机视觉的CNN模型后被证明对NLP有效,并在语义分析、搜索查询检索、句子建模和其他传统NLP任务中取得了优异的结果。本文训练了一个简单的CNN,在一个无监督的神经语言模型得到的单词向量的基础上再加上一层卷积,最初保持单词向量静态,只学习模型的其他参数。这个简单的模型在多个基准上取得了很好的结果,这表明预先训练的向量是“通用”的特征提取器,可以用于各种分类任务。通过微调学习特定于任务的向量,可以得到进一步的改进。最后,作者描述了对网络结构的一个简单修改,通过拥有多个通道,允许使用预先训练的和任务特定的向量。
图1有两个通道的例句的模型结构
设xi ∈ Rk 为对应于句子中的第i个单词的k维词向量,句子长度为n,图1左侧是一个n*k的矩阵,表示一句话的n个词语,每个词语是一个k维向量,假设文本中最长的句子中的词个数为n,则 小于n 的句子填充为m。最终得到的词向量矩阵为 n * k。表示为:
其中,⊕是串联运算符。X_i:n为单词xi的串联(从第i个单词到第n个单词,把它们串联起来),卷积运算包含一个滤波器w∈R^hk,它被应用于单词h的窗口以生成一个新的特征。例如,特征c_i由单词x_i:i+h−1的窗口生成:
其中,b∈R是一个偏置项,w是权重,f是一个非线性函数。这个过滤器应用于句子{X_1:h, X_2:h+1, …, X_n-h+1:n}生成特征图:
然后在特征映射上应用max超时池化操作,并将最大值ˆc=max{c}作为与此对应的特征特殊过滤器。其思想是为每个特征映射捕获最重要的特征,即具有最高值的特征。这种池化方案可以处理可变的句子长度。此外,本文在倒数第二层使用了dropout以解决过拟合问题,当模型参数太多而训练样本少的时候容易出现过拟合问题。
| 项目 | SOTA!平台项目详情页 |
|---|---|
| CNN | 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/textcnn |
2、GRNN
这篇文章引入了一个神经网络,以统一的、自底向上的方式来学习基于向量的文本表示方法。该模型首次使用CNN/LSTM来学习句子表示,利用Gated RNN自适应地对句子的语义及其之间关系进行编码。
图2 文本级情感分类的神经网络模型。(w_i)^n代表第n个句子中的第i个词,l_n是句子长度
词向量表示词向量表示有两种实现方式:随机初始化或者预训练的方式。作者参考的是word2vec实现方案,并且用预训练词向量的方式以保留更多的语义信息。句子表示CNN和LSTM模型都可以用于句子编码。两种模型可以将非固定长度的句子表示成定长的向量,且不需依赖依存句法分析或者成分句法分析就能保留句子的词序等信息。作者在本文中使用CNN with multiple conventional filters of different widths的方式实现句子编码。作者在文章中分别使用宽度为1,2,3的卷积核去获取unigrams,bigrams和trigrams。为了得到句子的全局语义信息,作者随后接入一个average pooling layer,再接入tanh激活函数(作用是引入非线性),最后将整个句子的不同宽度卷积核的向量表示接入一个Average层,从而得到该句平均向量表示。整个过程如图3所示。
图3使用卷积神经网络进行句子合成
篇章表示一个最简单的实现策略是:忽略句间顺序,直接使用句向量的平均值作为该文本向量表示。先不考虑计算效率问题,这种方式并不能有效的保留句子之间复杂的语言关系(比如:原因结构,反义结构等)。CNN模型可以用来表示篇章,这种模型通过其线性层储存句间关系。RNN也可以实现,但基本的RNN模型存在缺陷:梯度消失或者梯度爆炸。在长句中问题就会凸显出来:梯度可能会呈指数级上升或者衰减,这就使得长距离依赖问题变得棘手。为了解决这个问题,作者将基本RNN改造成一种带有门控结构的RNN,这种方式类似于LSTM或者GNN,区别见下列转换函数:
该模型可以被看作是一个LSTM,它的输出门永远是打开的,因为我们更倾向于不抛弃句子的任何部分语义来获得更好的文本表示。图4(a)显示了一个标准的顺序方式,其中最后一个隐藏向量被视为情感分类的文本表示。我们可以做进一步的扩展,比如将隐性向量的平均值作为文本表示,这需要考虑具有不同颗粒度的历史语义的层次结构。该方法如图4(b)所示。进一步,可以以同样的方式使用前面的历史和后面的证据,并利用双向门控RNN作为计算工具。
图4 用门控递归神经网络进行文本文建模。GNN代表了门控递归神经网络的基本计算单元
组合的文本表示可以自然地被视为文本特征,用于情感分类而不需要特征工程。具体来说,首先添加一个线性层,将文本向量转化为实值向量,其长度为类号C。之后,添加一个softmax层,将实值转化为条件概率,其计算方式如下:
对于模型训练,作者使用黄金情感分布P^g(d)和预测的情感分布P(d)之间的交叉熵误差作为损失函数:
然后通过反向传播对整个参数集求损失函数的导数,使用随机梯度下降算法更新参数:
| 项目 | SOTA!平台项目详情页 |
|---|---|
| GRNN | 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/grnn-2 |
3、 CLSTM
神经网络在情感分类任务中取得了巨大的成功,因为它们能够减轻特征工程的任务压力。然而,由于存储单元的缺陷,如何在递归架构下对文档级情感分类的长文本进行建模仍有待研究。为了解决这个问题,本文提出了一个缓存的长短期记忆神经网络(Cached Long Short-Term Memory Neural Networks ,CLSTM)来捕捉长文本中的整体语义信息。CLSTM引入了一个缓存机制,它将内存分为具有不同遗忘率的几组,从而使网络能够在一个循环单元中更好地保持情感信息。由于标准的LSTM不可避免地会丢失有价值的特征,本文提出了一种缓存的长短期记忆神经网络(cached long short-term memory neural networks,CLSTM),通过引入缓存机制,在较长的步骤中捕捉信息。此外,为了更好地控制和平衡历史信息和传入信息,采用了LSTM的一个特殊变体,耦合输入和遗忘门LSTM(Coupled Input and Forget Gate LSTM,CIFG-LSTM)。在CIFG-LSTM中,输入门和遗忘门被耦合为一个统一的门,即i(t)=1-f(t)。用f(t)来表示耦合门: CLSTM旨在通过缓存机制捕捉长距离信息,该机制将记忆分为若干组,不同的遗忘率被视为过滤器,分配给不同的组。不同的组别通过 squashing 遗忘率的尺度来捕捉不同尺度的依赖性。遗忘率高的组是短期记忆,而遗忘率低的组是长期记忆。特别是,把存储单元分为K组{G_1, - -, G_K}。每组包括一个内部存储器c_k、输出门o_k和遗忘率r_k。不同组的遗忘率被压制在不同的范围内。LSTM修改如下:
为了更好地区分每组的不同作用,其遗忘率被squash到一个明显的区域。squash函数ψ_k(z)可以被形式化为:
图5 模型架构。不同风格的箭头表示不同的遗忘率。将带有星星的组送入全连接层进行softmax分类。下面是一个B-CLSTM的实例,文本长度等于4,记忆组的数量是3
双向CLSTM(B-LSTM)模型利用了额外的后向信息,从而增强了记忆能力。作者继续向CLSTM上引入双向机制,文本中的单词能够从上下文中获得信息。形式上,第k组的前向LSTM的输出为:
第k组的后向LSTM的输出为:
因此,将给定文本w_1:T中的每个词wt编码为(h_k()^t):
至此,用于文档级情感分类的特定任务输出层具有了对长文本进行建模的能力,可以使用本文提出的模型来分析文档中的情感。
| 项目 | SOTA!平台项目详情页 |
|---|---|
CLSTM | 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/clstm |
二、Aspect level
4、 TD-LSTM/TC-LSTM
本文首先提出了一种基本的长短期记忆(LSTM)方法,建模一个句子的语义表示,而不考虑被评价的目标词。然后,考虑目标词对LSTM进行扩展,得到目标依赖的长短期记忆模型(TD-LSTM)。TD-LSTM是对目标词与其上下文词的相关度进行建模,并选择上下文的相关部分来推断指向目标词的情感极性。该模型采用标准的反向传播方法进行端到端的训练,其损失函数为监督情感分类的交叉熵误差。最后,对目标连接的TD-LSTM进行了扩展,其中,合并目标与上下文词的语义关联。
图6 基本长短期记忆(LSTM)方法及其用于目标相关情感分类的目标相关扩展TD-LSTM。其中,w代表长度为n的句子中的词,{w_l+1, w_l+2, …, w_r-1} 为目标单词,{w_1, w_2, …, w_l}是前面的上下文单词,{w_r, …, w_n−1, w_n}是上下文词
如图6,TD-LSTM是以目标词为分界点利用两个LSTM,从目标词的左右向目标词方向进行上下文信息融合。具体来说,使用两个LSTM神经网络,一个左LSTM L和一个右LSTM R,分别对前面和后面的上下文进行建模。LSTM L的输入是前面的上下文加上目标字符串,LSTM R的输入是后面的上下文加上目标字符串。从左到右运行lstm l,从右到左运行lstm r,因为作者认为将目标字符串作为最后一个单元可以更好地利用目标字符串的语义。然后,将LSTM L和 LSTM R的最后一个隐藏向量连接到一个softmax层,对情感极性标签进行分类。还可以尝试对LSTM L和LSTM R的最后隐藏向量进行平均或求和。TD-LSTM相较于LSTM可以更好的结合上下文的信息,但是人在阅读时除了会考虑到上下文信息,还会考虑到语境,就是目标词与上下文之间的交互关系。由此本文提出了TC-LSTM,TC-LSTM就是简单粗暴的在输入上concat一个目标词的向量表示。该组件在构成句子时明确地利用目标词与上下文词之间的连接。目标字符串t,将目标t表示为{w_l+1, w_l+2…, W_r−1},因为目标可以是可变长度的单词序列,通过对t所包含单词的向量进行平均,得到目标向量v_target。TC-LSTM与TD-LSTM模型的区别是在TC-LSTM中,每个位置的输入是单词嵌入和目标向量v_target的连接。TC-LSTM可以更好地利用目标词和上下文词之间的联系来构建句子的表征。
图7目标连接长短期记忆(TC-LSTM)模型用于目标依赖的情感分类,其中w代表长度为n的句子中的词,{w_l+1, w_l+2, ..., w_r-1}是目标词,v_target是目标表示,{w_1, w_2, ..., w_l}是前面的上下文词,{w_r, ..., w_n-1, w_n}是后面的上下文词
最后,模型训练交叉熵损失函数:
其中,S为训练数据,C为情感类别数,s为一句话,Pc(s)是通过softmax层给出的预测s为C类的概率,(P_c)^g (s)表示C类是否是正确的情感类别,其值为1或0。通过反向传播对损失函数对所有参数求导,并用随机梯度下降法更新参数。
| 项目 | SOTA!平台项目详情页 |
|---|---|
TD-LSTM | 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/td-lstm-2 |
前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及API等资源。
网页端访问:在浏览器地址栏输入新版站点地址sota.jiqizhixin.com,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。
移动端访问:在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID「sotaai」,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。
标签:
-
2022-02-07 14:57:45
奇迹!绝杀!女足亚洲杯逆转夺冠!<
刚刚,中国女足上演逆转绝杀奇迹!她们在亚洲杯决赛中3:2力克韩国队,时隔16年再夺亚洲杯冠军!
-
2022-02-07 14:57:45
中国政府与阿根廷共和国政府签署共建“一带一路”谅解备忘录<
新华社北京2月6日电(记者安蓓)国家发展改革委6日称,国家发展改革委主任何立峰与阿根廷外交、国际贸易和宗教事
-
2022-02-07 14:57:43
中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明(全文)<
新华社北京2月6日电中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明一、应中方邀请,阿根廷
-
2022-02-07 14:57:40
春节假期国内旅游出游2.51亿人次<
春节遇冬奥,旅游年味浓。根据文化和旅游部数据中心测算,2022年春节假期7天,全国国内旅游出游2 51亿人次,同比
-
2022-02-07 14:57:40
中吉签署关于经典著作互译出版的备忘录 开启两国人文交流互鉴新阶段<
新华社北京2月6日电(记者史竞男)国家主席习近平6日会见来华出席北京2022年冬奥会开幕式的吉尔吉斯斯坦总统扎帕
-
2023-06-22 11:03:56
【全球新视野】经典情感分析模型总结(上)
机器之心专栏本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心
-
2023-06-22 10:20:14
当前短讯!福建日报社记者“对话崇武古城” 聚焦古城保护传承和活化利用
崇武古城,内有人文底蕴,外有碧海银滩,是我国沿海仅存的一座较为完整
-
2023-06-22 09:49:21
迪马济奥:托纳利已经就个人条款与纽卡斯尔联队达成...-天天热头条
迪马济奥:托纳利已经就个人条款与纽卡斯尔联队达成原则性协议,米兰方
-
2023-06-22 09:07:21
全球新动态:进口替代股票概念一览(2023/6/22)
进口替代股票概念一览(2023 6 22),进口替代概念股2023年有:1、科力
-
2023-06-22 08:11:41
概伦电子:融资净买入223.56万元,融资余额1.12亿元(06-21) 快讯
概伦电子融资融券信息显示,2023年6月21日融资净买入万元;融资余额亿
-
2023-06-22 06:59:27
环球今头条!给虚假探店戴上“紧箍”
给虚假探店戴上“紧箍”日前,湖北省黄石市市场监管综合执法支队对湖北
-
2023-06-22 05:59:28
国际油价21日上涨|环球速看料
国际油价21日上涨。截至当天收盘,纽约商品交易所8月交货的轻质原油期
-
2023-06-22 01:57:40
【天天报资讯】下列选项属于非流动资产的是 下列属于非流动资产的是()
1、C答案解析:非流动资产项目通常包括:可供出售金融资产、持有至到期
-
2023-06-21 23:31:29
焦点速读:今天缘何大跌
今天大盘大跌了,上证指数断头铡刀,各个股票软件都根据各种指标参数,
-
2023-06-21 21:42:53
兰台谱新篇是什么意思(你我无恙是什么意思)
来为大家解答以上问题。兰台谱新篇是什么意思,你我无恙是什么意思这个
-
2023-06-21 21:03:30
口袋妖怪攻略火红(口袋妖怪攻略)|当前速递
您好,现在蔡蔡来为大家解答以上的问题。口袋妖怪攻略火红,口袋妖怪攻
-
2023-06-21 20:02:31
焦点信息:孩子不去迪士尼会就自卑?杨子黄圣依直播间言论冲上热搜
近日,黄圣依和其丈夫杨子的直播带货言论冲上热搜。杨子在直播时说:“
-
2023-06-21 19:58:03
坎巴拉太空计划mod安装后是英文的_坎巴拉太空计划mod怎么安装 天天速递
1、在您安装的游戏目录下的Gamedata文件夹下。2、如何安装管理MOD:1
-
2023-06-21 18:52:44
全球实时:杭州奥拓机电股份有限公司_奥拓配置
1、奥拓在配置方面下足了功夫。豪华皮质座椅是同级车型中新奥拓独有。
-
2023-06-21 18:50:12
今日热议:网贷欠款5万会被上门催缴吗?网贷欠款还不起怎么办?|天天要闻
网贷欠款5万会被上门催缴吗?如果信用卡逾期,首先需要支付最低未还
-
2023-06-21 18:12:47
【全球新视野】金乡县胡集镇组织开展反电信诈骗宣讲活动
活动现场大众网见习记者林智通通讯员周文强济宁报道6月20日,济宁市金
-
2023-06-21 17:39:56
微导纳米:签订3.86亿元TOPCon电池设备销售合同 _全球观天下
南方财经6月21日电,微导纳米公告,近日与滁州亿晶光电科技有限公司签
-
2023-06-21 17:04:54
世界报道:恒玄科技跌6.44% 2020年上市超募27.6亿元
恒玄科技跌6 44%2020年上市超募27 6亿元
-
2023-06-21 16:46:00
讲真,夏天“衬衫”更适合这几种穿搭方式,利落大气又有格调-天天速看
随着年龄的增长,现在越来越喜欢极简风的穿搭,随性利落,在人群中算不
-
2023-06-21 16:14:38
煮黄酒、包粽子…… 年轻人“沉浸式”体验端午习俗 天天快播报
端午节到来,包粽子、煮黄酒、佩戴香囊、手编艾草花束……越来越多年轻
-
2023-06-21 16:07:35
很好看的一部剧,可以称为4、5月份消磨时间,放松自我的动漫|全球速看
从预告片开始,到pv1、2,纯物理系的绝对力量在魔法系校园里的一段精彩
-
2023-06-21 15:37:47
“双节”接踵 南航在疆计划执行航班1400余班次
继“最火”五一后,“最火”端午即将来临,加之古尔邦节5日假期紧随其
-
2023-06-21 15:17:56
国家开发银行发行190亿元农业农村基础设施专题金融债券
记者21日从国家开发银行获悉,该行近日在中央结算公司成功发行190亿
-
2023-06-21 15:22:51
省检察院第二检察部普法宣讲进企业护航民企助发展_全球热资讯
为推进主题教育走深走实,认真贯彻落实最高检“八号检察建议”,增强企
-
2023-06-21 15:01:31
环球快看:纪实:他,凭着才艺从湾里闯荡出去,最终却把生活演成了人间悲剧
文 春歌全文共3148字主演自然间有山与海,人世间有悲喜剧。说完金苟
-
2023-06-21 14:56:35
河北石家庄特色课堂:丰富多彩美育童心
6月20日,河北省石家庄市深泽县耿庄村小学,学生们正在练习“霸王鞭”
-
2023-06-21 14:38:06
新疆阿克苏市龙舟赛火爆开赛|焦点精选
船桨翻飞水花四溅,呐喊助威振奋人心。6月19日,新疆阿克苏市首届端午
-
2023-06-21 14:27:29
观热点:河南省养老金调整方案何时公布?2022~2023年河南省养老金调整方案细则最新消息(全文)
随着人口老龄化的加剧,养老金问题已经成为全球范围内的热门话题。明天
-
2023-06-21 14:17:57
董春梅_关于董春梅的简介 世界时讯
1、董春梅,盘锦市盘山县高级中学教师。本文关于董春梅的简介就讲解完
-
2023-06-21 13:59:18
西华师范大学是几本_西华大学是几本
1、才建了没好几年 是由几所专科学校合并而成的 现在是二本 但学