在Internet上搜索科学出版物。第2部分。在哪里以及如何搜索

继续 (从此处开始



1.3。搜索引擎-专业而并非如此



。通常,搜索结果主要取决于任务和请求的正确性。但是,这些结果通常一方面是



a)多余的

,另一方面b)是不完整的。



幸运的是,通常来说,作者和发布者都对搜索引擎对出版物的信息进行索引感兴趣,但是有一些细微差别:并非始终允许对pdf文件内容进行索引,并且在某些情况下,仅允许某些搜索引擎对网站进行索引(例如,最大的站点国内电子图书馆elibrary.ru一次禁止为Google索引大多数文件)。



其中,查询的结果取决于单词顺序和搜索所依据的IP地址。



如果我们谈论出版物搜索,那么“使用哪个搜索引擎”这个问题就有一个答案-Google(这不算专门的书目搜索引擎,下面是关于它们的信息)。



首先,谷歌相当全面地索引了网络的内容。其次,大量的高级搜索设置(包括使用运算符的设置)极大地方便了工作。第三,正如我已经指出的,即使pdf由图像组成并且文件中没有文本层,googl也会为pdf文件的内容建立索引。







, . Pander, C. H. (1830). Beiträge zur Geognosie des Russischen Reiches. St.Petersburg, Karl Kray. 150 S.







Google高级搜索设置。不幸的是,在Yandex上,大多数以前可用的高级搜索设置早已消失了,几乎没有什么东西可以按文件扩展名搜索(仅代替Google的文件类型:使用了mime运算符:)



要搜索出版物,最有用的是高级设置和运算符,可用于将搜索范围限制为文件某些格式(例如,使用文件类型pdf的pdf),某些站点/域。例如,如果我需要查看哪些中国站点以pdf格式发布了出版物,其中提到了炸药,那么该查询将有所帮助:炸药文件类型:pdf站点:cn...好吧,“ +”和“-”用于表示必需或不期望的术语。例如,在搜索有关头足类动物-炸药的信息时,通常不需要与曾经生活在中东且在圣经中经常提及的同名炸药或部落有关的信息。因此,可以通过以下方式更正请求:ammonites文件类型:pdf -explosives -Bible

如果要查找特定出版物,则最好其标题的一部分或整个标题用引号引起来。



Google还有两个与搜索出版物直接相关的独立项目也很重要:



1)Google图书实际上是一个单独的搜索引擎,可对大量书籍,杂志,藏品和其他出版物的内容建立索引。同时,有很大一部分出版物可以pdf格式下载(通常,这些都是20世纪初或更早的旧版本);根据IP的不同,可供下载的出版物列表可能会有很大的不同,美国用户可以使用的作品数量最多。



有很多出版物可供全部或部分查看。可以使用特殊程序(例如EDS Google图书下载器或插件)(例如Mozilla的Greasemonkey结合自动文件下载程序(例如Download Master))下载此类作品



最后,即使从通常无法以摘录视图形式查看的出版物中存在的信息中,也可以获得可观的收益。的确,此类出版物存在两个主要困难:



a)当然,您可以尝试在其他地方查找此类作品,但是仅在图书馆中提供这些作品的可能性很高。



b)来源名称(尤其是那些最初未用拉丁文提供的名称)名称上存在很多混乱,并且显示的信息通常不完整。



但是,这些片段中包含的信息可能非常重要,并且实际上无法通过其他方式找到。







这就是典型的Google图书发行版本在摘要视图格式中的样子:通常,缺少必要的书目信息的一部分(期刊的发行号,有时是出版物名称的重要部分)。如果杂志一年出版两期,那是很好的。如果是20?如果名称拼写错误怎么办?



2)Google学术搜索(俄语的Google Academy)。这是一个书目搜索引擎,可以很好地搜索文章本身及其链接,同时允许您立即复制根据流行引用类型(APA,哈佛,GOST等)格式化的出版物的标题。该系统的便利之处在于,不仅索引了出版商的网站,而且索引了专门的社交网络以及通常免费提供科学论文的各种站点,并且所有指向全文版本的链接都被分组到一个集群中。但是,Google学术搜索不会将所有出版物编入索引-使用相同的搜索查询“关键字”文件类型(pdf)很容易检查在Google和Google Scholar中。这种区别在罕见的关键字中特别明显。



好吧,Google Scholar最有用的功能是能够订阅各种通知(在本文的后续部分中对此有更多介绍)







在Google Scholar上发布关键字搜索。注意排序选项,时间范围选项和文章集群。



面向出版物的书目搜索引擎(BPS)现在非常多样化且众多。除了上述Google项目外,还可以注意以下网站,可以将其视为BPS:



1)索引世界各地大量出版物的网站。首先,这是ScopusWeb of Science,可以通过订阅获得(对于Scopus,还提供Elsevier期刊的审阅者的访问权限),以及将DOI分配给出版物的最大站点(CrossRef)或有关出版物,赠款,研究人员等的信息汇总。尺寸



除Dimensions外,所有这些都允许您搜索有关有限数据的信息-这主要是标题/关键词/简历。更糟糕的是,CrossRef在这里脱颖而出-搜索仅按名称进行,并且严格参考单词的形式。的确,从这一点来看,CrossRef具有比其他BTS索引更多的俄语出版物,而且,这是解决“我有出版物的名称,我需要找到其DOI”之类的问题的最便捷方法(无法找到所有这样的DOI)作为唯一的出版物数字标识符注册商,例如,还有DataCite-但奇怪的是,根本没有通用服务来解决这一问题。





在尺寸中简单搜索



Dimensions是最近才出现的一个非常有趣的项目,主要是由于各种不同的设置,广泛的出版物(仅对具有DOI的出版物进行了索引,但仍然比CrossRef上的出版物少)和全文本搜索。相反,您可以在此处选择不同的搜索选项(全文本/简历/标题和关键字)。结果可以以多种方式分类(日期/相关性/链接数/高度度量),并受不同参数(来源/作者/年份/主题等等)的限制。尺寸有不同的版本(包括付费版本和公司版本),此处仅考虑免费选项(我们尚未处理其他选项)。另外,您可以按出版物搜索信息,以及数据库和授权(后一种选项仅可通过订阅获得)。







Analytical view , , ( — 2016 2020 ). , , ..



“分析视图”选项卡中提供了其他选项。它们使您很容易了解现在或在选定时间范围内谁正在从事某个特定主题,这些人在哪些杂志上撰写文章以及与哪些人共同撰写。这是查找潜在的共同作者和审稿人的便捷方法,特别是对于刚刚开始研究某个主题并且对在全球范围内如何使用该主题不太了解的人而言。对于在文章中具有ORCID的研究人员,配置文件同时包含此标识符和Scopus作者ID,以及(如果有的话)Publons上的ResearcherID /配置文件(自动保留)。我再说一遍-Dimensions是一个非常有用的项目,也是一个直观的项目。您可以连续按一下所有按钮,然后进入所有选项卡。



2)科学出版物的最大国际发行者(爱思唯尔,威利,史普林格,泰勒和弗朗西斯等)和发行者(Ingentaconnect,GeoscienceWorld)的站点也可以视为专门的BTS。但是,将搜索结果限制在一个或另一个发布者或发行者中通常无济于事,而对于使您简短地熟悉特定主题可能很有用。



3)在某种程度上,BTS功能是由科学社交网络(Academia.eduResearchGate)以及社交网络的“混合”功能和书目管理者Mendeley来执行的(既有程序的离线版本,也有在线版本); Elsevier购买Mendeley之后,现在有许多Scopus选项可用。但是,googl对科学社交网络的内容进行了很好的索引,因此定期浏览更新Feed以寻找全新的内容是很有意义的。



4)在BTS的单独类别中,可以区分区域站点或专业站点,主要是在任何一个国家或多个国家中都有出版物的数据(例如,俄罗斯的National Electronic Library elibrary.ru,日本的国立信息学研究院国立图书馆法国),以及专门用于某些特定科学领域的专门站点(例如,生物多样性遗产图书馆)(BHL))



这种门户网站的一个特征是,它们非常不愿意允许第三方搜索引擎为其内容编制索引,因此,如果您需要查找法语或日语的内容,那么查看相关站点并在其中进行搜索会更可靠。







直到最近,在法国国家图书馆的网站上,整个界面都是法语,直到他们最终在该网站上首先附加了该网站的英文版本,然后通过IP自动翻译



另外,应该说关于BHL。对于以某种方式参与现代或化石生物研究的所有研究人员而言,这是一个极其有用的项目。该库的特点是来源广泛(包括各种稀有物)和特殊的搜索工具(例如“高级”搜索选项卡中的分类群搜索-如果有人在一组特定的动植物上收集材料,这是一种快速查找出版物的好方法)话题)。在BHL的缺点中,应该指出的是,通常会错误地识别文本层(使用错误的语言)以及默认插图的质量(错误的.djvu质量很差)。



由于图像质量通常对于分类学研究非常重要,因此此处最正确的方法是以jp2格式下载所需的出版物,然后处理文件(首先将其重新格式化为常规的jpg / tiff,然后再处理ScanTailor和OCR)。顺便说一句,BHL的所有出版物都发布在archive.org上,有时甚至更精确地在archive.org上进行全文搜索(这对于搜索任何稀有性可能是相关的-这里可能会遇到一些有趣的事情,包括用户上传的那些东西)。







在BHL上通过分类法搜索时的输出示例







如果需要高质量的PDF,最好使用“下载内容-下载书籍-下载JPEG 2000”方法保存文件,然后进行处理



而且,当然,如果您需要查找俄语出版物,那么必须cyberleninka一起图书馆中进行搜索。尽管图书馆的资源涵盖范围更大,但我们经常遇到图书馆要为文章付费的情况-并且在Cyber​​leninki网站上,同一篇文章属于公共领域。



尽管图书馆本身存在许多缺陷,但从诞生之日起似乎就无法做到(即使没有输入用户名/密码也无法下载甚至开放访问的作品;缺少英文版本以及可以选择订阅某些更新的选项),那里的搜索相当不错。但是,如果需要定期跟踪俄语杂志上的信息,那么也有必要单独建立指向必要出版物网站链接的目录-在电子书馆上,您无法猜测何时以及为什么它们可能突然关闭某些出版物。还有一件事-如果杂志不在公共领域,而是仅通过钱库和出版社的网站进行发行,然后通过出版社的网站发行,则文章可能会比较便宜(例如这种情况,例如,《石油工业》杂志)。







图书馆的高级搜索设置(在网站的主页上,在“高级搜索”链接的左上方)。以前的搜索查询的历史也保留在这里



。5)可以免费访问科学出版物的最大的“盗版”项目-SciHubLibGen-可被视为BTS,因为它们具有按出版物标题或关键字以一种或另一种形式进行搜索的能力。

而且,如果可以将sci-hub用作对Dimensions进行搜索的便捷补充,那么稀有的专论会定期出现在LibGen上,而在其他地方找不到–爱好者会对其进行扫描并将其私下发布在LibGen上。



最后,值得一提的是关于论文的搜索。尽管许多论文(包括现代俄语,有时甚至是很老的外国论文)都已在公共领域发布在Internet上并由搜索引擎进行了索引,但查看VAK网站以获取有关仅打算进行捍卫的最新论文的信息还是有意义的在那里,现在可以通过专业,关键词,防御日期和其他参数来搜索学位论文(在这种情况下,将针对VAK学位论文进行单独搜索,并针对有权独立授予学位的组织理事会进行捍卫的论文单独进行搜索)。但是有一个细微差别-如果您安装了uBlock Origin,那么它将阻止在此站点上进行搜索。







在VAK网站上进行搜索的示例



待续。



All Articles