2024年南京大学996信息组织与检索考研真题参考答案
一、名词解释(每题6分,共6题)
1.深网
深网(Deep Web)是指互联网上那些不能通过常规手段搜索到的信息。这些信息通常存在于需要用户登录或进行特定操作才能访问的网页和数据库中,例如社交媒体平台、会员制网站、电子邮件等。与浅层互联网(Surface Web)相比,深网的信息更加丰富和多样,但需要特定的技巧和方法才能获取。
2.zipf定律
Zipf定律是一种描述语言中单词频率分布的定律,由美国语言学家Zipf提出。该定律指出,在自然语言中,单词出现的频率与其在单词表中的排名成反比关系,即排名越靠前的单词出现频率越高,而排名越靠后的单词出现频率越低。
3.倒排文档
倒排文档是一种文档索引方法,用于快速查找文档中包含特定词汇的情况。具体来说,倒排文档将词汇和包含该词汇的文档列表关联起来,形成一个倒排列表。这样,当需要查找某个词汇所在的文档时,可以通过倒排列表快速定位到相关文档,
4.信息自组织
信息自组织是指在没有外部干预的情况下,信息系统能够自我组织和演化的一种现象。这种现象通常发生在复杂的信息网络中,如社交媒体、互联网等。信息自组织的机制包括信息的传递、扩