国内外文摘数据库信息检索综述

  • 投稿让你
  • 更新时间2018-03-04
  • 阅读量716次
  • 评分4
  • 66
  • 0

  1MEDLINE数据库


  MEDLINE是美国国立医学图书馆(TheU.S.NationalLibraryofMedicine,簡称NLM)最早的书目数据库,其包含生命科学领域,特别是生物医学方面的超过2200万期刊文献的题录及文摘信息。MEDLINE的一个显著特点是记录了NLM编制的医学主题词表(MeSH)的索引。MEDLINE是联机的医学文献分析与检索系统(MEDicalLiteratureAnalysisandRetrievalSystem),起源于1964年。是PubMed的主要部分,部分Entrez在线检索数据库是由美国国家生物技术信息中心(NCBI)来提供的。


  1.1数据库介绍


  起始年限:1946年-至今,还包含一些旧的资源。


  来源:大约40种语言5600多种学术期刊的引文及60种语言的旧版期刊,MEDLINE引文由NLM,国际合作伙伴和一些合作组织共同创建。


  更新:自2005年起,每天增加2000-4000条完整的题录信息。更新在11月至12月的几周内暂停主要是因为NLM要将医学主题词表添加进索引中。


  学科范围:MEDLINE的主体范围是生物医药与健康,此外还包括生命科学,行为科学,化学、生物工程,公共卫生,临床护理以及植物和动物科学领域。其中,生命科学覆盖率增加始于2000年。


  MEDLINE数据库挂靠在Webofscience平台上,包含各生命科学领域的期刊文章,记录超过1200万条,尤其偏重于生物医学领域。MEDLINE记录由NLM和协作伙伴创建。MEDLINE的来源出版物涵盖基本生物学研究和临床科学。学科类别包括护理学、牙科学、兽医学、药理学、健康相关学科和临床前科学。MEDLINE还包括对生物医学从业者、研究人员和教育工作者至关重要的生命科学方面的内容,包括生物学、环境科学、海洋生物学、植物和动物科学以及生物物理学和化学的某些方面内容。从2000年开始,生命科学的涵盖范围得到增加。到2001年年底,以前包括在单独的NLM专业数据库中的多数引文均已添加到了MEDLINE中。数据库收录范围从1950年至今。


  1.2检索技术


  1.2.1字段检索


  检索字段共包含25个字段,其中,主题-添加Mesh字段允许在主题检索中包括Mesh词表,此选项自动将每个检索词比对到Mesh主题词并扩展每个标题,使从属于主题词的词语也包含在检索中。作者标识符是指ResearchID或者ORCID标识符。Chemical字段可以从Chemical叙词中选择一个或多个物质名称,并将其传输至检索页面,可以使用布尔运算符AND或OR组配多个词语。识别代码字段可在记录中检索以下字段:PubMedID、订日期、LM唯一ID、SSN(包括印刷版和电子版)、子序列数据库名称、子序列数据库入藏号。分主题库是由专业主题定义的生物医学文献的子集,包括“AIDS/HIV、生物伦理学、生物技术学”18个分主题子库。


  1.2.2布尔逻辑


  AND:使用AND可查找包含该运算符分开的所有检索词的记录。


  OR:使用OR可查找包含被该运算符分开的任何检索词的记录。


  NOT:使用NOT可将包含特定检索词的记录从检索结果中排除。


  注意在“主题”字段中可以使用AND,但在“出版物名称”或“来源出版物”字段中确不能使用。


  1.2.3通配符


  *:表示任何字符组,包括空字符。?:表示任意一个字符。$:表示零或一个字符。


  有关通配符的规则:


  (1)在主题、标题、入藏号和识别标码这几个检索字段中可以使用左截词符。


  (2)在主题、标题检索中,如果使用左截词符或右截词符,那么至少在通配符后至少输入3个字符


  (3)在入藏号和识别代码检索中,如果使用左截词符,那么必须在通配符后至少输入1个字符


  (4)在作者检索中,检索姓氏时必须在通配符前输入至少两个字符


  (5)通配符可位于检索词的中间


  (6)不能在以下字符后面使用通配符:特殊符号(/@#)和标点符号(.,:;!)


  (7)不能在出版年检索中使用通配符


  (8)通配符出现在单词或名称中,不能对其检索


  (9)不能在引起的检索内使用$


  (10)在截词后匹配范围很广的情况下,尽量避免使用通配符。


  $对于查找同一单词的英国拼写和美国拼写非常有用,?对于检索最后一个字符不确定的作者姓氏非常有用。


  1.2.4短语检索


  若要精确查找短语,可用引号括住短语,例:“energyconversation”。若输入以连字号、句号或逗号分隔的两个单词,则检索词视为精确短语。特别说明:检索精确匹配的短语时,不可在引号内部使用$符号。


  1.2.5位置算符


  NEAR/x:使用NEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。该规则也适用于单词处于不同字段的情况。用数字取代x可指定将检索词分开的最大单词数。如果只使用NEAR而不使用/x,则系统将查找其中的检索词由NEAR连接且彼此相隔不到15个单词的记录。即表示下面两个检索式效果相同:(1)salmonNEARvirus(2)salmonNEAR/15virus


  在使用NEAR这一位置限定运算符时要注意以下两点:


  (1)不能在“主题”和“标题”检索式中将AND运算符作为NEAR运算符的一部分使用,即若两个词间逻辑关系是AND,则需加双引号将其引起来。


  (2)单词NEAR出现在标题中时,检索时需要拿双引号将其引起。


  SAME:在地址检索中,使用SAME将检索限制为出现在“全纪录”同一地址中的检索词。需要用括号来分组地址检索词。例:AD=(PortlandSAMEOregon)查找在记录“地址”字段中存在Portland、Oregon或Or(州缩写)的记录。


  特别说明,在其他字段使用SAME时,其作用与AND完全相同。


  1.2.6检索运算符优先顺序


  如果在检索式中使用不同的运算符,则会根据下面的优先顺序处理检索式:1)NEAR/x2)SAME3)NOT4)AND5)OR,使用括号可以改写运算符的优先级。上述所有的检索运算符均不区分大小写,可以使用大写、小写或混合大小写。


  1.3检索实例


  1.3.1检索题目及需求介绍


  检索题目:基于专利分析的二噁英检测技术发展趋势研究


  检索需求:查找有关基于专利分析方法对二噁英检测技术发展趋势进行研究的相关论文语种:英文,中文;文献类型:期刊论文,综述。


  提取关键概念,二噁英(Dioxin),是结构和性质相似的210种同类物或异构体的统称,包括75种多氯二苯并二噁英(Polychlorinateddibenzo-p-dioxins,简称PCDDs)、135种多氯二联苯呋喃(Polychlorinateddibenzofurans,简称PCDFs)。该化合物熔点较高,极难溶于水,极易在生物体内蓄积,且难以自然降解,对人体危害严重,可引起免疫系统损害和生殖障碍,具有很强的致癌性。其中,2,3,7,8-四氯代二苯并-对-二噁英(2,3,7,8-TCDD)是迄今为止人类已知的毒性最强的污染物。


  关键词选取:DioxinPCDDsPCDFsTCDDdetect


  1.3.2检索过程及结果


  检索关键词(DioxinorPCDDsorPCDFsorTCDD)anddetect,选择主题添加Mesh,检索结果共1644条数据,扩展Mesh主题词Dioxins,Tetrachlorodibenzodioxin,结果如下图所示。


  进一步修改检索式为(DioxinorPCDDsorPCDFsorTCDD)anddetectand(patentanaly*),检索结果只有1条,如下图所示。


  结果不相关,因此选择去掉“patentanaly*”这一关键词,最终确定选择第一次的检索式(DioxinorPCDDsorPCDFsorTCDD)anddetect,选择英文及中文,文献类型选择期刊论文及综述对结果进行精简,检索结果共有1593条数据。


  2LISA(LibraryandInformationScienceAbstracts)


  2.1數据库介绍


  图书馆学情报学文摘数据库(LibraryandInformationScienceAbstracts)是一款为图书馆专业人士和其他信息专员设计的国际摘要和索引工具。目前摘录了440多种期刊,来自68个以上的国家/地区及20多种不同的语言。每两周更新一次,每次新增500多条记录。


  起始年限:1969年-至今


  学科范围:信息管理、信息技术、互联网技能、知识管理、图书馆业、图书馆和档案、图书馆管理、图书馆技术、图书馆使用和用户、在线信息检索。


  文献类型:附录(BackMatter)、参考书目(Bibliography)、书评(BookReview)、病例报告(CaseReport)、案例研究(CaseStudy)、注释评论(Commentary)、会议文章(Conference)、报纸(Paper)、期刊文章(JournalArticle)、信件(Letter)、文学评论(LiteratureReview)、新闻(News)等一些常见文献类型。


  2.2检索技术


  2.2.1检索词


  可包含任何字母或数字。输入的检索词可为英语或任何其他语言,例如法语、西班牙语、希腊语和斯拉夫语等。检索词是否能检索出任何文档取决于数据库中是否有匹配内容或索引。它会自动忽略检索词中的标点符号字符,例如句号、逗号和冒号。如要检索包含下标或上标字符的化学式,可按正确顺序输入所有字符。例如,输入CH3CH2OH能正确检索出乙醇(CH3CH2OH)化学式的匹配项。


  2.2.2无用词


  任何“无用词”列表会被忽略,如“a”、“the”之类的。例如,如果输入“catinthehat”,则会针对“catANDinANDtheANDhat”进行检索。检索结果的默认相关性排序会将包含检索词的所有文档(通常包含“catinthehat”)列于结果列表顶部。


  2.2.3运算符、字段和特殊字符


  2.2.4运算符优先级(不区分大小写)


  PRE>NEAR>AND>OR>NOT


  2.2.5通配符和截词字符


  2.3检索形式及呈现方式


  检索结果的呈现方式有三种,按照相关性,先远后近、先近后远进行排序;


  每页显示条数10,20,50,100,默认50条;是否包括重复文档;有粗略查看和详细查看两种方式;输出方式;可以通过选择引用格式进行引用,是否有原文获取的链接:提供两个外部链接提供全文获取方式。


  2.4检索实例


  2.4.1检索题目及需求介绍


  题目选取:图书馆的营销策略研究


  需求分析:研究现在高校、科研院所的图书馆的图书利用情况,寻找国外图书馆的营销策略等文献资料,可以进行比对研究,对现有中国图书馆情况进行参考和借鉴。


  2.4.2检索过程及结果


  根据题目名称选取两个关键字“图书馆营销”(librarymarketing)和“策略”(strategy)进行高级检索。检索式为:su(librarymarketing)ANDsu(strategy),共得到21条结果。


  由于该研究题目比较通俗易懂,先查取相关中文文献,再插曲中的文献中提取了比较接近的关键词进行的检索。21条记录中,读取前两篇文章摘要后发现检索出来后的文章主题与研究题目及其相关,由此可以判断关键字选取比较准确,检索结果的查准率较高,通读该21篇文献可大致了解研究题目的情况。


  但文章较多偏向某一角度和特色方面的对图书馆的营销策略的研究,较少一个宏观的把握和情况介绍。


  根据LISA数据库页面的提示,可进行其他关键词组合的检索,由于做学术研究的图书馆一般为高校图书馆,便将图书馆这一关键词采取细化,选择“academiclibrary”替代,使检索结果更符合研究需要,同时进行比对检索。


  检索式如下:su(academiclibrary)ANDsu(marketing),共得到156条结果。


  从检索结果看文献题名更加符合整体角度的把握,如果要缩小文献规模便可采取出版日期的筛选,使结果更加接近现在研究的内容,富有时效性。选取2011年-2015年的出版时间进行筛选,得到81条结果,比较符合阅读规模。由此看出检索式的构建在文献检索时非常重要,直接关系到之后的研究。


  于夏薇(作者单位:中国科学技术信息研究所)