基于Python的Django框架实现的人物信息检索系统

基于Python的Django框架实现的人物信息检索系统 1 简介 这是一个利用Django搭建的一个人物信息检索系统,大约从Wikipedia爬取了10000 个人物信息

本文包含相关资料包-----> 点击直达获取<-------

基于Python的Django框架实现的人物信息检索系统

1 简介

这是一个利用Django搭建的一个人物信息检索系统,大约从Wikipedia爬取了10000 个人物信息,并且提取了其中 Infobox 的对应信息。

对于 Wikipedia 中爬取的信息,我们重新组织了其格式并且进行显示。

左侧为搜索页面,右侧为搜索结果,匹配的字段被高亮显示。

对于已经爬取的信息,我们提供了一个对其进行搜索的页面,可以根据关键词在 其中搜索,并且还可以根据原先 Infobox 中的标题进行特定字段的查询(例如 Born、 Died、Name、Nationality 等),同时还可以让用户自行添加可以查询的字段。

搜索的结果按照匹配的关键字个数从高到底排序后显示,如果结果过多将会分页显 示。同时匹配的关键字会被高亮标出。

左侧为搜索结果过多时的分页显示效果,右侧为按照字段搜索 Born 中含 1997 的人物结果。

Alan Turing 信息的展现。

2 部分实现

爬虫部分利用 BeautifulSoup 来处理获取的页面,提取 Infobox 中的信息。

具体来说,人物超链接的爬取是通过寻找 ID 为 mw-content-text 的元素下所有 li 标签的第一个超链接来实现的。在爬取完毕后检查是否存在 infobox,如果存在则开始 提取信息。由于其中信息具有一定规律(例如大部分信息是以标题、内容的形式来组织 的),只需要用 BeautifulSoup 提取相应的 以及 部分即可。 前端界面利用 Bootstrap 来优化显示效果。

关于数据的存储,在提取出信息后利用 JSON 来保存在 sqlite 数据库中,并且额外 提取出一个关键字字符串用于搜索。对于每个人物都会分配一个唯一的 ID 以方便索引。 分页功能利用了 Django 自带的 Paginator 类。查询关键词的高亮以及自定义字段 搜索框的增加与删除使用 Javascript 在前端完成。

参考文献

  • 文本搜索引擎的探究与设计(华南理工大学·张立)
  • 基于Docker的智能云平台系统的设计与实现(华南理工大学·曾圣钊)
  • XX公司人力资源管理系统的设计与实现(电子科技大学·龚畅)
  • 基于JAVA平台的企业人事档案管理系统的设计与实现(吉林大学·王晓君)
  • 基于JAVA平台的企业人事档案管理系统的设计与实现(吉林大学·王晓君)
  • 基于J2EE的分布式信息检索查询平台的研究(北京化工大学·高峰)
  • 基于J2EE的分布式信息检索查询平台的研究(北京化工大学·高峰)
  • 基于云的统一身份智能信息管理系统设计实现(华南理工大学·水凯凯)
  • 基于Docker的智能云平台系统的设计与实现(华南理工大学·曾圣钊)
  • 网络新闻中人物识别系统的设计与实现(北京邮电大学·刘畅)
  • 基于Docker的智能云平台系统的设计与实现(华南理工大学·曾圣钊)
  • 基于Python的非结构化数据检索系统的设计与实现(南京邮电大学·董海兰)
  • 基于JavaEE和XML的分布式信息检索系统设计与实现(山东大学·牛拥军)
  • 基于Java平台的网络资源搜索系统的设计与实现(电子科技大学·李梦雅)
  • XX公司人力资源管理系统的设计与实现(电子科技大学·龚畅)

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://m.bishedaima.com/yuanma/35271.html

相关推荐

  • 基于Springmvc+MyBatis+Spring+Bootstrap+EasyUI+Mysql的个人博客系统

    Blog-master 基于Springmvc+MyBatis+Spring+Bootstrap+EasyUI+Mysql的个人博客系统 参考文献 基于SSH框架的博客用户分享平台的设计与实现(河北工业大学·刘磊) 基于SSH框架的人力资源管理系统的设计与开发(电子科技大学·唐伟) 博客管理系统的设计与实现(吉林大学·赵岩) 基于SSH架构的个人空间交友网站的设计与实现(北京邮电大学·隋昕航) 基于MVC设计模式的博客系统的设计与实现(大连理工大学·侯林) 基于SSH框架的博客用户分享平台的设计与实现(河北工业大学·刘磊) 基于SSH框架模式的博客系统的设计与实现(西北师范大学·王刚成) 基于SSH2的轻博客系统的研究与实现(吉林大学·杨雪梅) 博客管理系统的设计与实现(吉林大学·赵岩) 基于OAuth2
    2024年05月14日
    4 1 1
  • 植物健康管理系统

    这是一个🔥🔥基于SpringBoot框架的植物健康管理系统设计与实现🔥🔥的项目源码,开发语言Java,框架使用的SpringBoot+vue技术,开发环境Idea/Eclipse
    2024年05月23日
    5 1 1
  • 基于SpringBoot框架的健身房管理系统

    这是一套采用Java语言编写的健身房管理系统的源代码,其构建于流行的SpringBoot框架之上,并结合了Vue技术进行开发,适用于Idea或Eclipse等开发工具
    2024年05月23日
    23 1 2
  • 新冠疫情相似句对判定之Python

    新冠疫情相似句对判定 Index 算法说明 代码说明 运行环境 运行说明 参考资料 1, 算法说明 本解决方案使用了基于病名\药名的数据增强+模型融合+训练时-测试时增强+伪标签的解决方案 * 基于病名\药名的数据增强 Data augmentation 根据比赛组织方的信息
    2024年05月14日
    5 1 1
  • 基于Python的数据库实现

    基于Python的数据库实现 1,需求分析 1,1 概述 从底层做起,实现数据库的组织,存储,检索,更新和索引等功能, 1,2 基本功能 设计特定的数据结构
    2024年05月14日
    2 1 2
  • 基于Python的Django框架实现的中式快餐厅管理信息系统网站

    基于Python的Django框架实现的中式快餐厅管理信息系统网站 1 初步调研 随着餐饮业的连锁和国外餐饮巨头的进入,餐饮业的竞争将越来越激烈:要想在竞争中处于不败之地
    2024年05月14日
    4 1 1
  • 基于JSP实现的美食餐饮管理系统

    基于JSP实现的美食餐饮管理系统 摘 要 越来越多的人接受了电子商务这种便捷,快速的交易形式,网上订餐的推出也很快受到了大家的欢迎,首先,简要地介绍了国内网络技术和信息产业的发展情况以及研究课题的现状
    2024年05月14日
    29 1 7
  • 基于Android的通讯录app开发与实现

    本研究旨在探讨基于Android平台的通讯录应用程序的开发与实现,随着移动互联网的快速发展,智能手机已成为人们生活不可或缺的一部分,通讯录作为手机应用的基础功能之一,在用户的日常沟通中扮演着重要的角色
    2024年05月07日
    10 1 2
  • 基于SSM和Mysql实现的图书管理系统

    基于SSM和Layui实现的图书管理系统 1, 项目介绍 通过一段时间对SSM整合的学习,对基本理论以及主要知识点的掌握,实现简易图书管理系统,当然肯定有很多可以改进的地方
    2024年05月14日
    15 1 4
  • 基于Java+SSH的在线教学交流平台、基于JavaWeb的在线教学交流平台

    在当今信息化时代,教育行业迎来了数字化转型的浪潮,基于Java+SSH框架(struts2+spring+hibernate)的在线教学交流平台应运而生,本研究旨在设计和开发一个全面的师生学习交流平台
    2024年05月07日
    13 1 4

发表回复

登录后才能评论