你和我的2019年R目标

December 31,2018
By

(本文首次发表于 马鞍儿R博客上的帖子,并对 188bet appR博主

我们再来一次,使用Twitter趋势作为博客素材!柯林费伊
通过分享他2019年的R目标发起了一场鼓舞人心的运动。

It's been quite interesting reading the objectives of other tweeps: what
they want to learn,制造,他们想如何参与
community,等。作为迈克·卡尼,,rtweet的维护者,下划线的,it
是优秀的阅读材料!!

…还有博客材料!让我把这些tweets拿出来标记一下
总结它们!!

免责声明:我后来看到了Jason Baik也一样
主意
and was
比我快,找到分析结果
here.

收集Twitter数据

如果你在用rtweet第一次,check outits
网站
有关使用和设置以及金宝搏网址
also refer toTwitter API docs
了解更多关于速率限制的信息,例如了解金宝搏网址
搜索端点不会让你收到超过6-9天的推特。

tweets<-rtweet::搜索tweets(“Rstats goals 2019",包括&rst=false)

I obtained 87 tweets from 85 unique users.Definitely not big data,但是
不错!!

令牌鸣叫

然后我开始用特定的
tokenizer::tokenize_tweets()。通过立体文本包裹。如果
你是新来的立体文本我建议你读一下its
作者
.A token in natural language
processing can be a word,line,等。这完全不同
象征性的概念rtweetfunctions (your API credentials).

The tweet tokenization is a"tokenization by word that preserves
用户名,hashtags,网址.So awesome,今天是第一次
我找到了一个使用它的机会!I also removed stopwords.

library("magrittr")stopwords<-rcorpora::corpora(“字/停止字/en“)$stopwordstokens<-tweets%>%dplyr::select(text)%>%tidyText::unnest_tokens(token,文本,token ="tweets",drop=false)%>%dplyr::filter(!token %in% stopwords)

Analyze tweets

Most mentioned topics

我先画了一个和杰森·拜克的相似的数字,with the
most common tokens.I too removed digits.

library("“Galt”)tokens%>%dplyr::mutate(token=stringer::str_remove_all(token,“[^ \x01-\x7f])) %>%  dplyr::mutate(token = stringr::str_remove_all(token,“[[:digit:]]"))%>%dplyr::filter(!%C中的令牌%1(““,“γ“RSTATS”,“目标“)) %>%  dplyr::count(token,sort=true)%>%dplyr::mutate(token=reorder(token,标记,n))%>%头(n=18)%>%ggplot()+geom棒棒糖(aes(token,n),尺寸=1.5,COL=鲑鱼)+hrbrthemes::theme_ipsum(base_size=12,轴\标题\大小=12)+坐标\翻转()

Most common tokens in 2019 R goals tweets

什么行动??

In this figure I identify verbs like学习,,完成,,,,建造
贡献.让我看看每一条线的样本。
这是动词小样本的行样本。

lines <- tweets %>%  dplyr::select(text) %>%  tidytext::unnest_tokens(line,文本,token ="“线”)示例动词<-函数(动词,lines){  set.seed(42)  dplyr::filter(lines,字符串::str_检测(行,paste0(verb,““))) %>%    dplyr::sample_n(3)}samples <- purrr::map_df(c("学习“,“完成,“write",““建造”,“贡献“)样本动词,lines)knitr::kable(samples)
line
3️⃣ learn how to make r packages and write my code so it could be made into an r package more easily
1。学习如何在R中进行空间分析
2️⃣ learn better way to automate feature engineering (neural nets) for text
1️⃣ finally finish all the courses and certifications i started last year on #coursera and #datacamp
2完成我的田径R包
3).完成我10月份开始的那个文本挖掘项目
4️⃣ write an advanced shiny book with bookdown 🎈
3️⃣ learn how to make r packages and write my code so it could be made into an r package more easily
1️⃣写htmlwidgets书
–构建我的第一个RSTATS包(目标是2但1是很好的:d)
2构建一个闪亮的web应用程序来探索tx staar数据
–定期使用F(X)并建立自己的软件包。cease patching.
5⃣ contribute to fosshttps://t.co/oh7mwcq50r
2 contribute more to #rstats community through #scicomm,β堆栈溢出etc
3) contribute to #swdchallenge (with r,DUH)

These actions are quite varied,e.g. writing is applied to software as
以及阅读材料。我的目标是总结推文,但我一直
想想看所有的书都很有趣!!

包装??

我想知道有多少令牌对应于一个包名。我
limited myself to CRAN packages,通过使用available.packages()
函数,but one could have a look at the的源代码
可获得的包裹
得到
an idea of how to find names of packages from Bioconductor and GitHub.

cran-pkg<-as.character(available.packages(contrib.url('https://cran.r-project.org','source'))[,“Package"])pkg_标记<-dplyr::mutate(标记,令牌=GSUB(““,““,token)) %>%  dplyr::filter(token %in% cran_pkgs)

Using the data I'll look at tweets with the most packages,而且大多数
经常打包。

pkg_tokens%>%dplyr::group_by(text)%>%dplyr::mutate(pkg_text=粘贴(toString(token)),text)) %>%  dplyr::count(pkg_text,sort = TRUE) %>%  head(n = 3) %>%  dplyr::pull(pkg_text)
## [1]"文件夹,blogdown,rmarkdown,克尼特闪亮的,maps I really like seeing all these #rstats 2019 goals.My own,按紧急程度排序:(n1)使用blogdown完成我的个人网站和联机产品组合\n2)开始使用项目工作流,rmarkdown,and knitr \n3) Create shiny apps for custom interactive maps"## [2]"inference,projects,进口,瑞斯特httr,xml2 MY_rstats 2019年目标:提高我的统计建模和推理技能\n2。培养业务素养,并将其应用于数据分析项目。Continue to post on my blog (1 post every 2 months)\n4.学习使用DBI导入数据,瑞斯特httr,and xml2"〔3〕闪亮的,模板,闪亮的,闪亮的,书呆子闪亮2019年我的状态目标:
        
         
          Improve shinydashboardPlus,BS4DASH和ARGONDASH..
          
           \N\N2
           
            
             Release new shiny templates \n3
             
              
               为https://t.co/k3babxyvma about shining打开咨询服务\n4金宝搏网址
               
                
                 Write an advanced shiny book with bookdown
                 
                  \n rstats shining咨询https://t.co/fyc7mhaew8““
                 
                
               
              
             
            
           
          
         
        

有假阳性,e.g.projectswas here meant as a word,不
包名。What 金宝搏网址about the most popular packages among the tweets??

dplyr::count(pkg_令牌,令牌,排序=真)
藏文:66 x 2代币N
             
         
          ##  1 shiny        16##  2 blogdown      9##  3 projects      9##  4 rmarkdown     9##  5 tidyverse     6##  6 bookdown      5##  7 purrr         4##  8 track         4##  9 caret         3## 10 markdown      3## # ...with 56 more rows
         
        

In this table,我们可以看到当前流行的软件包,apart from
“项目“,“跟踪“and"markdown".如果我正确阅读了清单
they're all developed at RStudio!!

结论

In this post I followed an approach similar toJason
Baik's

总结Twitter上公布的2019年R目金宝搏网址标:我收集了
带推rtweetand then used立体文本以及
总结它们。目标通常包括学习东西,金宝搏网址building
软件包(查找)我的名单
资源
and don't miss
这是斯蒂芬·德的提议
席尔瓦
),
并提到了rstudio软件包。

What 金宝搏网址about my own R goals,我还没有发推特?我没有做过
列表,but have exciting projects at work,and hope to keep
semi-consistently posting on this blog.一月份我也会去
从2019年开始,进行两次R会谈,,one at R-Ladies
Paris
和A
远程遥控康塔尔2019!!
快乐2019,I hope you can meet your own R goals!!

To leave a comment作者,please follow the link and comment on their blog: 马鞍儿R博客上的帖子.

188bet appR博客offers 每日电子邮件更新金宝搏网址 Rnews and tutorials关于以下主题: 数据科学,, 大数据,, r作业,可视化(可视化) ggplot2,, Boxplots,, 地图,, 动画)程序设计(程序) 演播室,, Sweave,, LaTeX,, SQL,, 日食,, 吉特,, 哈多普,, Web Scraping)统计 regression,, 主成分分析,, 时间序列,, trading还有更多…



如果你走这么远,why not 订阅更新 from the site?Choose your flavor: e-mail,, twitter,, 1188bet app,或 脸谱网...

Comments are closed.

Search 188bet appR-bloggers


Sponsors

千万不要错过更新!!
Subscribe to 188bet appR-bloggers接收
e-mails with the latest R posts.
(您将不再看到此消息。)

单击此处关闭(此弹出窗口将不再出现)