Google表格→Node.js→Google图表→名片站点→搜索中的前3位全名+专业化
基于表格数据,我决定在名片站点中补充有关将自动生成的出版物的信息。我想要得到的是:
- 最新的出版物摘要位于Google图表时间轴上。
- 自动生成输出数据,并将链接从Google表格链接到html版本的名片。
- 由于担心将来某些较旧的站点关闭,所有站点的文章都为PDF版本。
您可以在这里查看情况。使用Bootstrap,Google Charts和Google Sheets在Node.js平台上实现,以存储原始数据。
有关Google Spreadsheet中出版物的原始数据
Google Spreadsheet LynxReport:发布会计包含发布的所有源数据和分析。我通过手动输入文章的新链接来使“数据”选项卡上的信息保持最新,其余大部分自动下载。LynxReport
表的一部分:使用初始数据来统计发布内容
有关视图和注释的实际数据是通过公式加载的。
例如,要从Google表格的单元格中的Habr页面获取视图数,请使用以下公式:
=IF(
ISNUMBER(IMPORTXML(D6, "//*[@class='post-stats__views-count']"))
,
SUBSTITUTE(
IMPORTXML(D6, "//*[@class='post-stats__views-count']")
,",",".")
,
value(SUBSTITUTE(SUBSTITUTE(
IMPORTXML(D6, "//*[@class='post-stats__views-count']")
,"k","")
,",","."))*1000
)
公式并不是最快的选择,您必须等待大约半小时才能获得数百个职位。下载完成后,您可以在下面的屏幕截图中看到所有数字。他们提供了有关哪些主题很受欢迎以及哪些主题不受欢迎的答案。LynxReport
表的一部分:通过分析进行过帐
从电子表格中读取数据并转换为Google图表格式
要将这些数据从Google电子表格转换为名片网站,我需要将数据转换为Google Charts时间轴格式。名片网站上
Google图表的最终时间表 为了正确绘制此类图表,数据必须按以下方式组织:名片网站上Google图表的数据以html格式 要自动执行所有转换,我在Node.js下编写了一个脚本,该脚本可用在GitHub上。 如果您不熟悉Node.js,那么在上一篇文章中,我详细介绍了如何在不同系统下使用脚本:
- 视窗
- 苹果系统
- 的Linux
在此处 链接说明。原理相似。用于将脚本转换为所需数据格式并从站点生成文章的pdf版本
的脚本(所有行均会立即处理-我专门设置了延迟以录制此视频)的脚本,
为了以自动模式从google表中读取数据,我使用密钥授权。
您可以在Google Project管理控制台中获取此密钥:
Google Cloud Platform中的凭据
脚本完成后,应生成两个带有图形html数据的文本文件和在线文章的所有pdf副本。
我将数据从文本文件导入名片网站的html代码。
从站点生成文章的pdf副本
使用Puppeteer,我将文章的当前视图以及所有评论保存为pdf格式。
如果您不设置延迟,那么列表中的几十篇文章可以在短短几分钟内保存为pdf文件。
为了将评论加载到某些站点(例如-),需要延迟。
结果
由于开始编写脚本是为了更好地匹配搜索算法,因此您可以使用搜索来评估结果。
在这两种情况下,按名称和姓氏搜索以及专业指示均会返回到我的文章甚至是名片网站的链接:
在Yandex搜索结果中:
在Google搜索结果中:
如果名片为empenoso.github.io,我仍然无法决定是否值得注册一个单独的域名在搜索的最上面吗?
而不是结论
- 也许这篇文章会让某人思考他在Internet上的样子。
- 也许本文可以帮助某人建立会计和出版物组织。
- 该脚本的源代码位于GitHub上。
上传者 :米哈伊尔·沙丁(Mikhail Shardin
)2020年8月17日