没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:王香|2018-12-27 10:26:06.000|阅读 509 次
概述:在本教程中,将向您展示如何使用Wikipedia API,NodeJS和Highcharts提取和可视化Pageviews Analysis数据。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
维基百科是信息和数据的重要来源; 每秒超过10次编辑。在英文维基百科单独获得每天600页新的文章。但维基百科还提供了许多用于浏览网页统计数据的工具,例如网页浏览分析,维基百科排名,维基百科API等。如果你像我一样热衷于DataViz,这是一个宝库数据!
在本教程中,将向您展示如何使用Wikipedia API,NodeJS和Highcharts提取和可视化Pageviews Analysis数据。 MediaWiki提供了一个非常简单的维基百科API,不需要API密钥。 2017年7月1日至6月3日提取维基百科网页国际空间站的日期和用户视图,然后在交互式图表中绘制趋势图(请参阅下面的GIF):
备注 您可以从以下Github链接下载本文中使用的代码。 我使用以下Wikipedia API结构:https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia/all-access/user/International_Space_Station/daily/2017070100/2018060300。请注意在第10个字段中使用页面名称,在第12个字段中使用日期。
要处理API调用,我使用request-promise包。 首先,让我们创建一个文件夹来保存代码。浏览到您创建的文件夹并安装request-promise包:
npm install --save request npm install --save request-promise
当我使用highcharts库时,我需要使用此命令行安装它:
npm install highcharts
要安装的最后一个包是browserify。
npm install browserify
Browserify允许我将整个代码(包括Highcharts库)编译成单个js文件,我可以将其作为脚本包含在HTML网页中。 我将首先显示代码(您可以复制并粘贴),运行它; 然后我会为你审查代码。
创建一个新的js文件(例如:code.js),并复制/粘贴下面的代码:
var rp = require('request-promise'); var Highcharts = require('highcharts'); var options = { method: 'GET', uri: '//wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia/all-access/user/International_Space_Station/daily/2017070100/2018060300', json: true, }; rp(options) .then((parseBody) => { var arrData = []; var year, month, day; for (i = 0; i < parseBody.items.length; i++) { year = parseBody.items[i].timestamp.slice(0, 4); month = parseBody.items[i].timestamp.slice(4, 6); day = parseBody.items[i].timestamp.slice(6, 8); arrData.push([new Date(year + '-' + month + '-' + day).toDateString(), parseBody.items[i].views]); } year = parseBody.items[0].timestamp.slice(0, 4); month = parseBody.items[0].timestamp.slice(4, 6); day = parseBody.items[0].timestamp.slice(6, 8); // Create the chart Highcharts.chart('container', { title: { text: 'Views of the International Space Station Wikipedia webpage' }, subtitle: { useHTML: true, text: 'Source: Wikipedia' }, xAxis: { type: 'datetime', dateTimeLabelFormats: { day: '%y/%b/%e' } }, yAxis: { title: { text: 'Number of views' } }, series: [{ name: 'views', data: arrData, pointStart: Date.UTC(year, month, day), pointInterval: 24 * 3600 * 1000 // one day }] }); });
创建一个HTML文件(例如:chart.html),然后复制/粘贴下面的代码:
<html> <head>> <script src="bundle.js"></script> </head> <body> <div id="container"></div> </body> </html>
要运行代码,只需在终端上执行此命令行,然后单击HTML文件以查看结果。browserify code.js > bundle.js
创建了Options对象,其中包含发出请求所需的所有信息。此路由不需要任何身份验证,因此它应该非常简单。
var options = { method:'GET', uri:'//wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia/all-access/user/International_Space_Station/daily/2017070100/2018060300 ', json:true, };
该对象包括:
以下代码启动整个提取数据过程:
rp(options) .then((parseBody) => { …. });
parseBody,保存从维基百科中获取的数据:
...{"project":"en.wikipedia","article":"International_Space_Station","granularity":"daily","timestamp":"2018021700","access":"all-access","agent":"user","views":4549},{"project":"en.wikipedia","article":"International_Space_Station","granularity":"daily","timestamp":"2018021800","access":"all-access","agent":"user","views":4896},{"project":"en.wikipedia","article":"International_Space_Station","granularity":"daily","timestamp":"2018021900","access":"all-access","agent":"user","views":4634},{"project":"en.wikipedia","article":"International_Space_Station","granularity":"daily","timestamp":"2018022000","access":"all-access","agent":"user","views":4701} ...,
该内容parseBody有很多信息,但我只对观看次数和日期感兴趣。要提取这些数据,我使用以下循环:
for (i = 0; i < parseBody.items.length; i++) { year = parseBody.items[i].timestamp.slice(0, 4); month = parseBody.items[i].timestamp.slice(4, 6); day = parseBody.items[i].timestamp.slice(6, 8); arrData.push([new Date(year + '-' + month + '-' + day).toDateString(), parseBody.items[i].views]); }
请注意,我使用三个变量来处理日期:年,月和日。这是因为维基百科中的日期结构为YYYYMMDD。我更喜欢Unix时间戳,因为它更容易管理。哦,好吧...... 一旦提取了所有这些数据,我就使用Highcharts构建图表:
Highcharts.chart('container', { title: { text: 'Views of the International Space Station (Wikipedia webpage)' }, subtitle: { useHTML: true, text: 'Source: Wikipedia' }, xAxis: { type: 'datetime', dateTimeLabelFormats: { day: '%y/%b/%e' } }, yAxis: { title: { text: 'Number of views' } }, series: [{ name: 'views', data: arrData, pointStart: Date.UTC(year, month, day), pointInterval: 24 * 3600 * 1000 // one day }] });
这就是你如何使用NodeJS和Highcharts可视化维基百科网页浏览分析。
购买TeeChart Pro AciveX正版授权,请点击“”哟!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@wqylolg.cn
在本文中,将介绍一个新集成演示,包括 DHTMLX Grid 和 Pivot,并将重点介绍DHTMLX的开发团队使用这些小部件创建 JavaScript 数据透视网格时使用的一些技术技巧。
解析PDF意味着从 PDF 文件中提取结构化或非结构化数据。由于 PDF 的结构复杂,因此这可能具有挑战性。在本文中,我们将学习如何使用 Aspose.PDF for Python 在 Python 中解析 PDF。在本指南结束时,您将能够使用 Python 从 PDF 文档中提取文本、表格和图像。
单元格边框是指在单元格或单元格区域周围添加的线条。它们可用于不同的目的,如分隔工作表中的部分、吸引读者注意重要的单元格或使工作表看起来更美观。本文将介绍如何使用 Spire.XLS for .NET 在 C# 中添加或删除 Excel 单元格边框。
Excel 中的切片器是一种简单易用的工具,可以帮助用户过滤数据,让数据分析变得更加直观,交互性更强。这篇文章将介绍如何使用 Spire.XLS for .NET 在 C# 中添加、修改和删除 Excel 切片器。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@wqylolg.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢