博客档案

创建一个闪亮的应用程序来探索历史报纸:一步一步的指南

2月3日,2019
通过
创建一个闪亮的应用程序来探索历史报纸:一步一步的指南

今年我从探索一个未知的世界开始,the world of historical newspapers.I did not know that historical newspapers data was a thing,并在卢森堡国家图书馆出版的各种数据集中尽情探索。You can findthe data here.In my first blog post,我分析了来自卢森堡独立的数据…

阅读更多»

利用数据科学阅读19世纪以来卢森堡10年的报纸

1月30日2019
通过
利用数据科学阅读19世纪以来卢森堡10年的报纸

我一直在研究报纸的历史数据(见这里和这里)。我从最大的档案中提取了数据,正如前一篇博文所述,现在创建一个闪亮的仪表盘,它可以可视化每篇文章中最常见的单词,as well asread a summary of each article.The summary was made using a method called...

阅读更多»

理解METS和ALTO XML标准

1月12日2019
通过
理解METS和ALTO XML标准

上周我写了一篇博客文章,分析了一年来19世纪报纸的广告。The data is made available by thenational library of Luxembourg.In this blog post,这是2部分系列的第1部分,我从257gb的存档中提取数据,它包含了L'Union十年的出版物,另一个19世纪的卢森堡语…

阅读更多»

看看19世纪一家卢森堡报纸上的广告

1月3日2019
通过
看看19世纪一家卢森堡报纸上的广告

卢森堡国家图书馆发表了一些非常有趣的数据集;浏览历史报纸!有几个数据集可以下载,从250mb到257gb。I decided to take a look at the 32gb "ML Starter Pack".It contains high quality scans of one year of the L'indépendence Luxembourgeoise (Luxembourguishindependence) from the year 1877.让生活更容易…

阅读更多»

R或Python ?为什么不两个呢?在R中使用带有{网状}的蟒蛇

12月29日2018
通过
R或Python ?为什么不两个呢?在R中使用带有{网状}的蟒蛇

这篇简短的博客文章说明了由于{网状}包,在同一个R笔记本中使用R和Python是多么容易。为了让它起作用,you might need to upgrade RStudio to the current preview version.Let's start by importing {reticulate}:library(reticulate){reticulate} is an RStudio package that provides "a comprehensive set of tools for interoperabilitybetween Python and R".与…

阅读更多»

一些有趣的{gganimate}

12月26日2018
通过
一些有趣的{gganimate}

Your browser does not support the video tag.In this short blog post I show you how you can use the {gganimate} package to create animationsfrom {ggplot2} graphs with data from UNU-WIDER.WIID dataJust before Christmas,UNU-WIDER released a new edition of their World Income Inequality Database:*NEW #DATA*We've just released a new version of the World Income Inequality Database.WIID4 includes #data...

阅读更多»

对象类型和一些对初学者有用的R函数

12月23日,2018
通过
对象类型和一些对初学者有用的R函数

这篇博客文章是我的电子书现代R与tidyverse的摘录,你可以在这里免费阅读。这摘自第二章,它解释了不同的R对象,你可以操纵以及一些函数,让你开始。R中的所有对象都有一个给定的类型。你……

阅读更多»

使用tidyverse不仅仅用于数据操作:使用蒙特卡罗方法估计pi

12月20日2018
通过
使用tidyverse不仅仅用于数据操作:使用蒙特卡罗方法估计pi

这篇博客文章是我的电子书现代R与tidyverse的摘录,你可以在这里免费阅读。这摘自第五章,which presentsthe {tidyverse} packages and how to use them to compute descriptive statistics and manipulate data.In the text below,我将向您展示如何使用{tidyverse}函数和原理来估计…

阅读更多»

使用{润滑脂}轻松操作日期

12月14日2018
通过
使用{润滑脂}轻松操作日期

这篇博客文章是我的电子书现代R与tidyverse的摘录,你可以在这里免费阅读。这摘自第五章,which presentsthe {tidyverse} packages and how to use them to compute descriptive statistics and manipulate data.In the text below,我从维基百科上刮下一张表,这表明非洲国家从其他国家获得独立…

阅读更多»

hyper-parameters是什么,以及如何处理它们;岭回归的一个例证

12月1日2018
通过
hyper-parameters是什么,以及如何处理它们;岭回归的一个例证

这篇博客文章是我的电子书现代R与tidyverse的摘录,你可以在这里免费阅读。这摘自第七章,它处理统计模型。在下面的文本中,我解释超参数是什么,例如,我使用{glmnet}包运行岭回归。这本书还在写,socomments是……

阅读更多»

搜索R-blo188bet appggers


赞助商

永远不要错过更新!
订阅R-bloggers188bet app接收
电子邮件与最新的R职位。
(您将不会再次看到此消息。)

点击此处关闭(此弹出窗口将不再出现)