%重命名(doc_id=id,文本=反馈)%>%udpipe(“法语口语”,trace=10)获取一个带有正负词的法语情感词典词典词典,否定者,放大器和去放大器加载(文件(“))加载(文件(“))极性术语”/>

你用tidyText做了一个情绪分析,但是你忘了做依赖性分析来回答为什么是积极/消极的东西

1月8日,二千零一十九
通过

(本文首次发表于 bnosac::open analytical helpers-bnosac::open analytical helpers,并对 188bet appR博主

关于不断增长的UDPIPE R包.2018年最后一个月,我们已经更新了克兰的包裹,有一些明显的变化

  • 默认模型现在与函数udpipe_download_model一起下载,现在是基于通用依赖项2.3构建的模型(2018-11-15发布)
  • 这意味着udpipe现在已经60种语言的模型.这是正确的!它们提供标记化,语音标记部分,基于所有这些树链接的柠檬化和依赖分析:南非荷兰语非洲繁荣,古希腊-珀尔修斯古希腊普罗伊勒,阿拉伯语PADT,亚美尼亚Armtdp,巴斯克BDT,白俄罗斯HSE保加利亚BTB布里亚特BDT,加泰罗尼亚安哥拉,中国GSD,科普特写字楼,克罗地亚集捷克CAC,捷克CLTT,捷克捷克PDT,丹麦滴滴涕,荷兰语Alpino,荷兰拉斯莫尔,英语EWT,英国胶英文台词,英语部分,爱沙尼亚芬兰联邦贸易委员会,芬兰TDT法国GSD,法式公寓法国红杉,法语口语,加利西亚CTG加利西亚Treegal,德国GSD,哥特式普洛伊尔希腊语gdt,希伯来语印地语HDTB匈牙利语Szeged,印度尼西亚GSD,爱尔兰IDT,意大利ISDT意大利帕特意大利邮政,日本GSD哈萨克斯坦KTB,韩国GSD,韩国KIST,库曼基MG,拉丁语ITTB,拉丁英仙座,拉丁语拉脱维亚LVTB立陶宛健康、安全与环境,马耳他泥巴马拉西乌法尔北萨米-吉拉,挪威博克马尔,挪威尼诺斯克,挪威尼诺斯科利亚,老教堂旧的法语-srcmf,波斯色拉纪,波兰LFG,波兰语SZ,葡萄牙波斯克,葡萄牙BR,葡萄牙语GSD,罗马尼亚非标准,罗马尼亚RRT,俄罗斯GSD,俄罗斯Syntagrus,俄罗斯针叶林,梵语UFAL,塞尔维亚套装,斯洛伐克snk,斯洛文尼亚SSJ,斯洛文尼亚海温,西班牙安哥拉,西班牙GSD,瑞典线,瑞典语Talbanken,泰米尔TTB特鲁古MTG土耳其imst,乌克兰IU,上索布语UFAL,乌尔都UDTB,维吾尔族乌特语,越南VTB.
  • 虽然这不是我们最初的打算增加了情绪评分功能在最新版本中(起重机上的0.8版)结合依赖分析的输出,这样就可以回答“什么导致了负面情绪”。下面显示的示例。
  • 如果要将udpipe模型用于商业目的,我们为您提供了一些不错的额外预培训型号-联系如果你在找这个。

下面我们将通过查找什么导致了负面情绪.

如果我看到立体文本感情用事包我一直想知道他们是否为喜欢构建报告做感情用事评分,因为他们报告的主要内容是作为积极或消极字典一部分的单词出现频率。也许他们的经理问他们。“是的,但为什么情绪是消极的或积极的”。
您可以使用依赖性分析来回答这个管理问题。这正是udpipe提供的(除了其他nlp注释)。相关性分析将每个单词链接到另一个单词,让我们找出哪些词与否定词相关联,让您了解为什么有些东西是否定的,以及在您的业务中需要改进什么。让我们来演示一下如何在R中轻松完成这项工作。

下面我们以法文获取了500条Airbnb客户评论的样本,使用udpipe对其进行注释(使用构建在法国狂想曲)使用新的情绪评分txt_情绪,可在新的udpipe版本中使用法语的正负词在线词典。接下来,我们使用udpipe依赖性分析输出,通过查找dep ou rel udpipe输出中的adjuctival修饰符“amod”,并可视化链接字典的否定词的所有单词。结果是这张图表显示了字典中的红色单词和其他颜色的链接到该单词的单词。

情感与依赖分析

下面显示了显示如何完成此操作的完整代码。

库(UDCube)
图书馆(DPLYR)
图书馆(Magrittr)
数据(布鲁塞尔审查,package=“udpipe”)
x<-布鲁塞尔审查%>
筛选器(language=“fr”)%>%
重命名(doc_id=id,文本=反馈)%>%
udpipe(“法语口语”,迹=10)
第七章
##找一本法语情感词典,字典里有正反两个词,否定者,放大器和去放大器
第七章
加载(文件(“https://github.com/sborms/sentometrics/raw/master/data-raw/feel_fr.rda“)
加载(文件(“https://github.com/sborms/sentometrics/raw/master/data-raw/vale-raw/valshifters.rda“)
极性术语<-重命名(feel-fr,术语=x,极性=y)
极性负离子<-子集(Valshifters$Valence_Fr,t==1)$x
极性放大器<-子集(Valshifters$Valence_Fr,t==2)$x
极性放大器<-子集(Valshifters$Valence_Fr,t==3)$x
第七章
##根据开放的法语词汇做情绪分析
第七章
情感<-txt情感(x,术语=引理,
极性术语=极性术语,
极性负极=极性负极,
极性放大器=极性放大器,
极性放大器=极性放大器)
情感<-情感$数据
  • 上面没发生什么奇想。我们将udpipe用于NLP注释(标记化,勒姆化,语音标记和相关性分析的一部分)。情绪得分不仅与情绪词典有联系,而且寻找可能改变情绪的相邻词。
  • 结果数据集如下所示

富铀管

现在我们可以回答这个问题-为什么是负面的

这是通过使用udpipe的依赖关系输出,从我们的情绪词典中找出哪些单词与负面单词相关联。不熟悉依赖关系的用户,查看dep eu rel字段的可能标记定义:依赖项分析输出.在这种情况下,我们只取“amod”的意思,我们在寻找修饰名词的形容词。

##使用cbind_依赖项添加关键字链接到的父标记
原因<-情感%>
cbind_dependencies()%>%
选择(文档ID,引理,令牌,UPOS,情绪极性,托肯父母们,Lemma_父母,超亲亲本,DePrReR)%%%
滤波器(情感极性<0)
头(原因)
  • 现在,我们不再制作一个显示哪些负面词语出现的情节,而这些负面词语似乎是TidyText用户所热衷的,我们可以制作一个图来显示否定词和这些否定词所关联的词,以指示否定词的上下文。
  • 我们选择否定词的引理和父词的引理,并计算它们一起出现的次数。
原因<-筛选(原因,百分比“amod”中的dep_rel%
单词“cooccurences<-reasons%”%
群由(引理)Lemma_父级)%>%
总结(COOC=n())%>%
安排(-COOC)
顶点<-绑定\行(
数据帧(key=unique(reasons$lemma))%>%变异(在_dictionary=if_else(key%in%polarity_terms$term中,“在字典中”,“链接到”),
数据帧(key=unique(setdiff(原因$lemma_parent,原因$lemma)))%>%突变(在_dictionary=“linked to”))
  • 下面使用ggraph进行可视化。
图书馆(Magrittr)
图书馆(GCGRID)
图书馆(IGraph)
首席运营官20)
设定种子(123456789)
COOC%>
从数据帧(顶点=过滤器(顶点,%c中的键%(COOC$LEMMA,COOC$lemma_parent)))%>%
ggraph(layout=“fr”)。+
geom-edge-link0(aes(edge-alpha=cooc,边缘宽度=COOC)+
geom节点点(aes(colour=in_dictionary)尺寸=5)
geom节点文本(aes(label=name)Vjust=1.8,col=“深绿色”)。+
ggtitle(“哪些词与否定词相关”)。+
主题(void)()

这生成了上面显示的图像,显示否定词的上下文。现在,根据您自己的数据执行此操作。

如果您对上述技术感兴趣,您可能还对我们最近的开源NLP开发感兴趣:

  • 特克斯特兰克:文本摘要
  • 铬铁矿:实体识别,分块和序列建模
  • BTM公司:短文本上的位主题建模(例如调查答案/Twitter数据)
  • 瑞姆泰霍:星空顶部的神经文本模型(用于文本分类的神经模型,单词/句子/文档嵌入,文件建议,实体链接完成和实体嵌入)
  • UDCube:标记化通用NLP包,勒姆化,语音标记部分,形态学注释,相关性分析,关键字提取和NLP流

享受吧!

发表评论作者,请关注他们博客上的链接和评论: bnosac::open analytical helpers-bnosac::open analytical helpers.

188bet appR博客提供 每日电子邮件更新金宝搏网址 R新闻和 教程关于以下主题: 数据科学大数据, r作业,可视化(可视化) ggplot2型箱形图地图动画)程序设计(程序) 演播室斯维夫乳胶SQL日食吉特哈多普刮网)统计 回归主成分分析时间序列交易还有更多…



如果你走这么远,为什么不 订阅更新 从网站上?选择您的口味: 电子邮件推特1188bet app,或 脸谱网……

注释已关闭。

搜索R-Blo188bet appggers


赞助商

千万不要错过更新!
订阅R-Bloggers188bet app接收
最新R帖子的电子邮件。
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)