大数据分析django基于python的影片数据爬取与数据分析的论文

2023-12-27 07:59

本文主要是介绍大数据分析django基于python的影片数据爬取与数据分析的论文,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘 要

快速发展的社会中,人们的生活水平都在提高,生活节奏也在逐渐加快。为了节省时间和提高工作效率,越来越多的人选择利用互联网进行线上打理各种事务,通过线上管理影片数据爬取与数据分析也就相继涌现。与此同时,人们开始接受方便的生活方式。他们不仅希望页面简单大方,还希望操作方便,可以快速锁定他们需要的影片数据爬取与数据分析方式。基于这种情况,我们需要这样一个界面简单大方、功能齐全的系统来解决用户问题,满足用户需求。
课题主要分为两大模块:即管理员模块和用户模块,主要功能包括系统首页、个人中心、用户管理、电影管理、系统管理等;
关键词:影片数据爬取与数据分析;简洁方便直观;

Abstract

In the rapidly developing society, people’s living standards are improving, and the pace of life is gradually accelerating. In order to save time and improve work efficiency, more and more people choose to use the Internet to manage all kinds of online affairs, through online management film data crawling and data analysis have emerged. At the same time, people began to accept convenient lifestyles. They not only want simple pages, but also want easy to operate, can quickly lock the video data crawl and data analysis methods they need. Based on this situation, we need such a simple and elegant interface, functional system to solve user problems, to meet user needs.
The topic is mainly divided into two modules: administrator module and user module, the main functions include the system home page, personal center, user management, film management, system management, etc.
Key words: Film data crawling and data analysis; Simple, convenient and intuitive;

目录

摘 要 1
Abstract 2
目录 1
1绪论 3
1.1 研究背景 3
1.1.1国内研究现状 3
1.1.2国外研究现状 3
1.2研究的目的和意义 4
1.2.1研究目的 4
1.2.2 研究意义 4
1.3 论文的内容和结构 4
2系统相关技术概述 5
2.1 Python语言 5
2.2 Django框架 5
2.3 MySQL数据库技术简介 6
2.4 B/S结构 7
3系统需求分析 8
3.1需求分析概述 8
3.2可行性分析 8
3.2.1技术可行性 8
3.2.2经济可行性 8
3.2.3运营可行性 9
3.2.4法律可行性 9
3.3系统功能需求分析 9
3.3.1系统功能概述 9
3.3.2系统用例分析 9
3.4系统其他需求分析 10
3.4.1性能要求 10
3.4.2安全要求 11
3.4.3作业环境要求 11
3.5系统流程分析 11
3.6本章小结 13
4 系统设计 14
4.1系统结构图 14
4.2数据库设计 14
4.2.1数据库设计原则 14
4.2.2数据库的概念设计 14
4.2.3数据库表设计 16
4.3本章小结 18
5系统的实现 19
5.1系统登录注册实现 19
5.2管理员模块实现 20
5.3用户模块实现 22
5.4本章小结 23
6系统测试 24
6.1系统测试的重要性 24
6.2性能测试 24
6.3系统登录测试 24
6.4电影测试 25
6.5系统简介测试 25
6.6本章小结 25
结 论 26
参考文献 27
致 谢 28

1绪论

对于当今社会的人们来说,影片数据爬取与数据分析是必不可少的,随着经济和技术的不断发展,计算机已经深入到各个领域。影片数据爬取与数据分析将人们的时间需求与计算机技术结合起来,架起一座桥梁,使影片数据爬取与数据分析更加方便快捷。影片数据爬取与数据分析主要为人们提供系统化、个性化、专业化的服务,以提高人们的愉悦感。
1.1 研究背景
网络发展的越来越迅速,它深刻的影响着每一个人生活的各个方面。每一种新型事务的兴起都是为了使人们的生活更加方便。影片数据爬取与数据分析是一种低成本、更加高效的电子商务方式,它已慢慢的成为一种全新的管理模式。人们不再满足于在互联网上浏览、发布信息和人与人之间的聊天,而是希望互联网能为人们的生活带来更多便利。伴随着网络的崛起,影片数据爬取与数据分析开始变得越来越普遍。
1.1.1国内研究现状
在现实生活中,根据传统做法,有些人选择通过电话或短信进行交流。这种方法比较单一,在有些方面效率不高,需要大量人力和财力,已经接近淘汰。另一种方法是使用系统,但有些系统对计算机和用户的要求很高,使用起来非常复杂,无法快速锁定他们满意的信息。用户也将束手无策。目前,市场上很少有类似的系统能够真正满足用户的需求,帮助用户完成各项事务。
1.1.2国外研究现状
在当今社会,由于国外经济的高度发达,对于服务于人们生活的影片数据爬取与数据分析,国外花费了大量的人力、物力和财力来开发这类系统。所以,国外的这种系统较为发达。另一个重要原因是,国外更开放,更容易接受新事物,对他们享受的服务更挑剔,因此,影片数据爬取与数据分析一开始可以被更多的人接受,更多的人提出更多的要求,使影片数据爬取与数据分析更加完善。经过多年的发展,该系统具有很高的艺术性,非常规范和完整。

1.2研究的目的和意义

1.2.1研究目的
互联网发展的越来越快了,在当下社会节点,人们也开始越来越喜爱影片数据爬取与数据分析。通过互联网可以对图片、描述、动画等方式全面加强产品宣传,极大地满足影片数据爬取与数据分析在现代管理中的要求。如果想实现简单快捷方便的影片数据爬取与数据分析,即时生效,无需重新打印。这时仅仅需要在背景中单击鼠标,它将立刻更新点击处一整行的所有内容。影片数据爬取与数据分析使用了B/S模式,并且不需要安装第三方插件,他们甚至能直接在手机上随机随地实现影片数据爬取与数据分析,还能实现更加准确的提供电影信息。现社会无论各行各业都应尽量摒弃传递错误信息,尤其是口头传输信息。而网络却并不会像电话那样一次只能传输一次,效率低下还间连不断,每当处于高峰时段,用网络来处理信息也就会更加的容易。我们甚至可以通过宣传让更多的潜在用户知道。不需要发送传单来节省宣传和人力成本。影片数据爬取与数据分析的方式得到了更好的改进。从而提高了整体业务量。
这样做的目的是节省时间,提高工作效率,享受当今社会最便捷、最周到的服务。
1.2.2 研究意义
线上影片数据爬取与数据分析提供了良好的发展空间,随着人们生活质量的提高,人们对服务质量的要求越来越严格。人们希望拥有更好的影片数据爬取与数据分析体验。而且,影片数据爬取与数据分析服务有着使用常规电话交流比不了的便捷高效简单等优势。影片数据爬取与数据分析就是为广大劳动人民提供这样一个方便的系统,以满足人们的需求。
1.3 论文的内容和结构
本文一共把内容主要分为六个大部分,采用传统面向对象的方法进行划分并描述和分析每个部分的需求:
第一章是前言部分,该部分主要是拓展了方案的背景,对此系统的意义做了思考,对价值做了评估。
第二章是概述系统的相关技术,详细的介绍了系统所使用的相关语言和开发结构。
第三章是对系统的需求进行分析,对可行性需求,功能需求和流程等做相关分析。
第四章主要对程序的功能做分析,并描述了数据库等相关内容的设计。
第五章主要是论述影片数据爬取与数据分析各部分相关功能页面。
第六章主要是进行系统功能测试。

2系统相关技术概述

2.1 Python语言
Python是由荷兰数学和计算机研究学会的吉多•范罗苏姆于20世纪90年代设计的一款高级语言。Python优雅的语法和动态类型,以及解释型语言的本质,使它成为许多领域脚本编写和快速开发应用的首选语言。Python相比与其他高级语言,开发代码量较小,代码风格简洁优雅,拥有丰富的第三方库。Python的代码风格导致其可读性好,便于维护人员阅读维护,程序更加健壮。Python能够轻松地调用其他语言编写的模块,因此也被成为“胶水语言”。
Python的应用场合非常广泛,在科研领域中,可以用Python训练人工智能模型,也可以对实验数据进行数据分析。在生活中,Python提供了很多优秀的、开源的Web开发框架,例如Django、Flask、Pyramid、Tornado等。知乎、豆瓣网、Youtube等知名应用都是由Python为基础进行开发的。相比于其他框架,Django有着更加丰富的插件,作为企业级框架也很好上手,适合本次开发。此次系统是开发一个Web应用,采用Django框架,将在下一节进行具体介绍。本次开发选用的是Python3.6.4版本。
2.2 Django框架
Django用Python编写,属于开源Web应用程序框架。采用(模型M、视图V和模板t)的框架模式。该框架以比利时吉普赛爵士吉他手詹戈·莱因哈特命名。该架构的主要组件如下:
1.用于创建模型的对象关系映射。
2.最终目标是为用户设计一个完美的管理界面。
3.是目前最流行的URL设计解决方案。
4.模板语言对设计师来说是最友好的。
Django被官方称之为“完美主义者框架”,只需要很少的代码就能更快的完成一个优秀的Web应用[4]。Django采用了MTV框架模式,此模式根据MVC进行改进形成了更适于Django的设计模式。M为模型(Model)、T为模板(Template)、V为视图(View)。Django对象关系映射(ORM,Object-Relation-Mapping):ORM的方法论有着三个核心原则:
① 简单:以最基本的形式构建数据。
② 传达性:数据库结构被任何人都能理解的语言文档化。
③ 精确性:基于数据模型创建正确标准化的结构。
用于Python之中即是以Python类形式定义数据模型,类中的每一个属性对应着数据库中的一列。引入ORM后,无需编写原生SQL语句,使用基于面向对象的思想去编写类、对象、调用方法等,ORM会将其映射成SQL语句通过pymysql执行。
2.3 MySQL数据库技术简介
MySQL是一种轻量级、高效率的数据库。它有各种字段、主键、外键等特性。大多数个人或者企业在进行软件开发时必需用到的数据库。因为其极强的可移植性而广泛应用于众多系统服务中。MySQL使用的SQL语言是访问数据库最常用的标准化语言[4]。
MySql做为瑞典公司MySql AB开发的中小型开源数据库智能平台,具备配备低、低成本、运作速度更快的优势。与此同时,因为社区版的开源平台性,变成了许多网址减少开发成本费的最佳选择。被甲骨文回收后,MySQL也发布了商业版。另外Mysql具有以下特性:
(1)使用C和C++编写,并使用了多种编译器进行测试,保证源代码的可移植性。
(2)为C、C++、Eiffel、Java、Perl、PHP、Python、Ruby和Tcl等多种编程语言提供了API。
(3)采用多线程并行的方法提高了CPU的利用率。
(4)改善算法,有效地提高查询速度。
数据库在软件项目中扮演着操作管理数据的角色同时还能够保证数据的独立性、一致性和安全性,并为系统访问数据提供有效方式不仅如此数据库还能大大减少程序员开发程序时间。在日常能够接触实用的一般有两类数据库,一类是以(Oracle,DB2,SQL Server,MySQL )为代表的关系型数据库和以(NoSql、MongeDB)为代表的非关系型数据库,两类数据库各有各的优缺点。其中非关系型数据库又分为网络数据库和层级数据库。-网络数据库是指在计算机网络系统中应用数据库技术然后借助网络技术将存储于数据库中的大量信息及时发布出去;在成熟的数据库技术的帮助下,计算机网络实现了对网络中的各种数据的有效管理,用户与网络中的数据库数据交互也借此得以进行。IMS也是最早研制成功的数据库系统。关系数据结构、关系操作集合、关系完整性约束构成了关系模型。作为数据库另外一种区分方式的存储介质被大家分为磁盘和内存这 两种。例如:关系型数据库就存储在磁盘中,非关系型数据库则存储在内存中。典型的关系型数据库有:Oracle、DB2、Microsoft SQL Server、Microsoft Access、MySQL、SQLite。小型关系型数据库:Microsoft Access,SQLite;中型关系型数据库:SQL Server,Mysql;大型关系型数据库:Oracle,DB2。
大家常用的其他关系形数据库系统大多是MySQL AB公司开发的,其中MySQL也是由这家开发的,所应用的分布式数据库管理系统是客户机/服务器体系结构得益于此结构,而且用这个系统建造的数据库具有很强的适用性,用C和C++编写的系统让他拥有很强的适用性所以他可以在大部分操作系统上使用并能和php结合。不同的API函数针对不同的语言(C,C++,JAVA等)来处理不同数据;为了更好地支持多CPU多线程通过使用核心线程来实现;提供的存储机制分为事务和非事务存储机制;MySQL采用双重许可,不管是从MySQL AB公司获得正式的商业许可又或是许可条款下以免费软件或开放源码软件的方式使用MySQL软件都是被允许的。
MySQL作为数据库拥有很多优点,其中由于是开放源码,所以使用成本特别低,而它体积小的特点决定了速度快的特性。因此,My Sql具有开放性,多线程支持多种API,可跨数据库连接,国际化,数据库体积巨大等特点。简单的来说 ,MySql是一个开放的、快速的、多线程的、多用户的数据库服务器。
选用MySQL作为数据库的其中一个原因就是支持多线程,支持多线程的特点为利用系统资源提供了便捷并因此大大提高了系统运行速度和效率,而且连接数据库的方式多样包括但不局限于TCP/IP、ODBC和JDBC等途径;但是没有东西是完美无缺的,即便MySQL也如此,虽说它有着众多优点但其功能不够强大,规模也相对较小,无法应对大型数据哭的处理。但是对于本系统来说,选用MySQL作为数据库,其功能性能已绰绰有余,如果要进行二次开发的数据库表结构空间的扩展也是完全可行的。综上所述,MySQL是作为本系统数据库的最优选择。
2.4 B/S结构
浏览器/服务器(B/S)是一种比它的前身更简单的体系结构。它使用Web服务器来完成数据的传输和通信。只要把浏览器作为客户端下载下来,你就可以简化你的工作,所以你不必担心安装软件的问题。

3系统需求分析

3.1需求分析概述
影片数据爬取与数据分析主要是为了提高用户的工作效率,满足用户对更方便、更快、更好地存储所有信息和数据检索功能的要求。通过对多个影片数据爬取与数据分析网站的合理分析,确定了影片数据爬取与数据分析的各个模块。考虑到用户的可操作性,经过深入调查研究,遵循系统优化和开发的原则。
为了实现当前网络的分析功能和便利性,影片数据爬取与数据分析使客户能够在平台上直接查看他们需要的数据信息,不仅可以节省管理时间,还可以改变传统的管理模式。由于时间有限,很难亲自会面和沟通,因此很难满足客户的需求。因此,迫切需要开发一个影片数据爬取与数据分析,以满足用户的需求,提高用户的使用率。影片数据爬取与数据分析必须更快、更有效地向用户或潜在用户提供信息。为影片数据爬取与数据分析建立更好的沟通平台,提高用户信息交流系统的服务效率。该系统可以满足大多数用户提出的问题,用户可以根据自己的需要获得相应的服务,为影片数据爬取与数据分析提供了一条快捷的途径。

3.2可行性分析
影片数据爬取与数据分析研发出来可以为广大人民群众解决影片数据爬取与数据分析管理的问题,大大降低人民时间成本,不需要将无谓的时间浪费在道路上,并且影片数据爬取与数据分析可以更大化的将信息展露在人们的眼前供其选择。它是一款多用户使用的系统,比较符合业务逻辑,是通过互联网解决复杂和单调问题的典型案例。
3.2.1技术可行性
技术可行性是分析系统都需要用到哪些技术知识,语法是否规范标准,代码量多大,是否具有可移植性,基于python的影片数据爬取与数据分析能够真正的实现数据层和表示层的分离[6],以及页面是否可以做到美观实用,是否吸引眼球。网站是否足够稳定,后端管理页面是否足够方便管理,数据库的构建是否可以符合系统要求,是否需要搭建集群等等。
3.2.2经济可行性
通过结合以上对系统的技术和可行性分析来判断对系统经济状况的预算是否大于系统开发资金的比例。因此,通过分析系统的业务模式和开发者模式,不会浪费大量资金,系统的使用价值大于资本价值[7]。
3.2.3运营可行性
可操作性是指将系统开发所涉及到的所有功能全都实现,代码收尾工作完成后对用户消费水平,系统的业务能力是否与用户消费水平所对等,是否可以满足大部分消费者的需求,页面是否美观,能否让用户满意,代码显示是否为轻量级,操作和功能是否简单便捷,是否同时适用。系统能否同时应用于windows、linux等操作系统,这取决于系统的可移植性。python语言的适应性非常强,基本上能够较好的适应目前市场环境中所流行的各个平台[8]。也就是说python的可移植性很强,那么系统的价值越高,可行性也就越强。
3.2.4法律可行性
该影片数据爬取与数据分析是面向大众开源化和不收取任何费用的。它的主要目的是帮助人们解决影片数据爬取与数据分析问题。完全符合法律可行性要求,系统内部权限划分不会导致内部用户泄露系统机密。对于用户信息,系统有保护措施,用户密码在数据库中加密,并有严格的自我控制和商品价格解释。
3.3系统功能需求分析
在功能方面,不需要用户在指定场所进行影片数据爬取与数据分析,要保证可以在很大程度上满足用户解决影片数据爬取与数据分析问题,满足用户需求,改善人们生活。
3.3.1系统功能概述
管理页面:管理员和用户都可以登录。通过输入账号和密码后,校验无误后方可进入对应的主界面,管理员可对用户使用的权限管理,以及对网站信息进行管理[9]。
3.3.2系统用例分析
本课题要求实现一套基于python的影片数据爬取与数据分析,系统主要包括管理员和用户两大功能模块。
(1)管理员用例图如下所示:
在这里插入图片描述

图3-1管理员用例图
(2)用户用例图如下所示:
在这里插入图片描述

图3-2用户用例图
3.4系统其他需求分析
3.4.1性能要求
在开发了一个功能较为良好系统之后,首要考虑的就是它的性能要求,比如当用户使用它进行点击或提交功能时,它会产生多久的延迟,系统响应速度快不快,如果短时间同时有较多用户访问网站是否会产生系统崩溃,是否采用高并发接口,另外,存储功能进行中的代码量是否满足算法和数据结构,以及是否占用较大内存等:
(1)系统应具备快速的反映时间,对于并发特征得到解决[10]。
(2)系统对用户密码是否进行了加密并进行大量安全处理。
(3)系统代码量是否简洁,不会占用计算机太多内存。
3.4.2安全要求
对于安全要求要进行可靠性分析,可靠性分析有利于可实现安全性、可靠 性设计与系统功能设计在数据源上的统一[11]。就本系统的安全性能而言,数据的账户和密码需要以明文形式显示,并严格加密。更改密码、修改个人数据、添加信息需要相应权限。
3.4.3作业环境要求
(1)系统:Windows系统足够,兼容性强
(2)Web服务器:内置tomcat,无需安装、运行和使用
(3)数据库服务器:MySQL 5.5及以上,图形界面为SQLYG
(4)浏览器:谷歌或Firefox开发者浏览器
(5)JDK1.8及以上,内置插件maven等。
3.5系统流程分析
(1)个人信息流程图
用户在成功进入系统以后,可以获得姓名,性别,联系电话等个人信息。获得个人信息的流程见图3-3所示。
在这里插入图片描述

图3-3个人信息流程图流程图
用户进行登录操作的流程图如图3-4。
在这里插入图片描述

图3-4 登录界面流程图
用户进行注册操作的流程图如图3-5。
在这里插入图片描述

图3-5 用户注册流程图

3.6本章小结
本章主要介绍影片数据爬取与数据分析的使用案例和系统的相关可行性要求。我已经从技术、经济、法律和运营四个方面确认了该系统可以在线运行。

4 系统设计

4.1系统结构图
影片数据爬取与数据分析分为两个部分,即管理员和用户。该系统是根据用户的实际需求开发的,贴近生活。从管理员处获得的指定账号和密码可用于进入系统和使用相关的系统应用程序。管理员拥有最大的权限,其次是用户。管理员一般负责整个系统的运行维护和总体协调。
系统结构如图4-1所示。
在这里插入图片描述

图4-1系统结构图
4.2数据库设计
所有的网站设计但凡有数据都离不开数据库,数据库是所有项目想实现如数据获取,数据传输等功能的基石。只有合理化的数据库设计才能满足商业化的要求,数据库的主键外键连接方式特别的重要,尽量避免多对多的复杂性,字段名合理规范,且通俗易懂等,字段应根据业务进行设定,不允许操作多字段而对系统产生占用多余的内存。
4.2.1数据库设计原则
设计原则自然就是要符合范式的要求,多表之间的关系要合理,理应符合系统的实际情况。
4.2.2数据库的概念设计
概念设计是将整体分为在地面上表达出来的单个个体。E-R图形象的连接了实体模型和概念模型。因此,E-R图需要根据数据库表和表字段进行合理设计,表达的概念知识点用图形描述,可以直观地让相应人员清楚,并分解整个E-R图[13]。我们通常表达不清晰没有概念的东西。但是通过E-R之间的联系,E-R模型法是对这种模糊概念的事务最简单、最常用的设计方法。
(1) 用户实体属性图如下图4-2所示。
在这里插入图片描述

图4-2用户实体属性图
(2) 电影实体属性图如下图4-3所示。
在这里插入图片描述

图4-3电影实体属性图
(3) 系统简介实体属性图如下图4-4所示。
在这里插入图片描述

图4-4系统简介实体属性图
4.2.3数据库表设计
数据库表的设计通常是根据业务逻辑设置的。数据库模型在数据库中设计,并根据模型创建数据库表[14]。
表4-1:用户
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
addtime timestamp 创建时间 CURRENT_TIMESTAMP
yonghuming varchar 200 用户名
xingming varchar 200 姓名
mima varchar 200 密码
xingbie varchar 200 性别
lianxidianhua varchar 200 联系电话

表4-2:用户表
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
username varchar 100 用户名
password varchar 100 密码
role varchar 100 角色 管理员
addtime timestamp 新增时间 CURRENT_TIMESTAMP

表4-3:关于我们
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
addtime timestamp 创建时间 CURRENT_TIMESTAMP
title varchar 200 标题
subtitle varchar 200 副标题
content longtext 4294967295 内容
picture1 longtext 4294967295 图片1
picture2 longtext 4294967295 图片2
picture3 longtext 4294967295 图片3

表4-4:电影
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
addtime timestamp 创建时间 CURRENT_TIMESTAMP
daoyan varchar 200 导演
bianju varchar 200 编剧
zhuyan longtext 4294967295 主演
leixing varchar 200 类型
diqu varchar 200 地区
yuyan varchar 200 语言
shangyingriqi varchar 200 上映日期
pianchang varchar 200 片长
pingfen varchar 200 评分
xiangqing longtext 4294967295 详情
fengmian longtext 4294967295 封面
mingcheng varchar 200 电影名称
laiyuan varchar 200 来源

表4-5:配置文件
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
name varchar 100 配置参数名称
value varchar 100 配置参数值

4.3本章小结
通过本章针对影片数据爬取与数据分析功能的总体结构、E-R属性图和数据表的大概介绍,对在开发系统时所要涉及到的数据库进行简单设计,为下一章系统的实现做好铺垫。

5系统的实现

5.1系统登录注册实现
系统登录,在登录页面选择需要登录的角色,在正确输入用户名和密码后,进入操作系统进行操作;系统登录界面如图5-1所示:
在这里插入图片描述

图5-1 系统登录界面

用户注册:在登录页面注册按钮,进入用户注册界面,输入用户信息点击注册进行用户注册操作,用户注册界面如图5-2所示:
在这里插入图片描述

图5-2 用户注册界面

5.2管理员模块实现
管理员进入主页面,主要功能包括对系统首页、个人中心、用户管理、电影管理、系统管理等进行操作。管理员主界面如图5-3所示:
在这里插入图片描述

图5-3 管理员主界面

管理员点击用户管理。进入用户页面输入用户名可以查询,新增或删除用户列表,并根据需要对用户信息进行查看详情,修改或删除操作。如图5-4所示:
在这里插入图片描述

图5-4用户管理界面

管理员点击电影管理。进入电影页面可以查询,新增,删除或爬取数据电影列表,并根据需要对电影信息进行查看详情,修改或删除操作。如图5-5所示:
在这里插入图片描述

图5-5电影管理界面

管理员点击系统管理。进入系统简介页面输入标题可以查询系统简介列表,并根据需要对系统简介信息进行查看详情或修改操作。如图5-6所示:
在这里插入图片描述

图5-6系统管理界面

管理员点击跳转到看板。进入看板页面可以查看类型、评分、地区、语言、电影总数和导演等详细数据分析。如图5-7所示:
在这里插入图片描述

图5-7数据分析界面

5.3用户模块实现
用户进入主页面,主要功能包括对系统首页、个人中心、电影管理等进行操作。用户主界面如图5-8所示:
在这里插入图片描述

图5-8 用户主界面

用户点击电影管理。进入电影页面可以查询或爬取数据电影列表,并根据需要对电影信息进行查看详情操作。如图5-9所示:
在这里插入图片描述

图5-9电影管理界面

5.4本章小结
第五章主要内容是系统实现,分别实现了对管理员功能的管理,对用户的管理,完成了系统全部功能设计。

6系统测试

在系统开发上市前都需要经过严格的系统测试。主要测试访问请求的延迟时间,对于一些未知和危险的问题,需要严格的测试和解决方案。
6.1系统测试的重要性
对于程序来说,系统测试应该根据程序的指定业务、程序的承载能力、程序代码的效率、数据库服务器的存储和设计进行测试。
6.2性能测试
若同时有大量用户和大量请求进入是看服务器是否响应延迟时间来比较性能的。我们可以从代码,程序逻辑,接口使用,数据库优化等方面逐个做仿真测试。
为了保证测试的有效性和程序的安全性,我们主要从两个方面进行测试:一是系统功能节点测试,二是接口业务逻辑测试。
经过第一和第二两个部分的测试后,我们判定项目没有风险。
6.3系统登录测试
测试编号:a。
目的:测试登录模块,测试系统能否对正确进行登录放行,拦截错误数据进行页面返回。
前提:未登录的用户进行登录,用户名为“aaaa”,初始密码为“00000”。
方法:实地测试。
测试用例表,如表6-1所示。
表6-1登录模块测试用例表

6.4电影测试
测试编号:2。
目的:单元测试电影,测试电影页面能否正常显示,能否增删改操作。
前提:进入电影管理页面。
方法:实地测试。
测试用例表,
如表6-2所示。
表6-2电影测试用例表
序号 输入 预期结果 实际结果 测试结果
a

b 添加电影A,并填写全部电影
添加电影B,未填写全部电影 提示添加成功

提示添加失败 提示添加成功

提示添加失败 通过

通过
6.5系统简介测试
测试编号:3。
目的:测试页面功能能否正常运行
前提:能进入后台管理页面。
方法:手动测试。
测试用例表,如表6-3所示。
表6-3系统简介测试用例表
序号 输入 预期结果 实际结果 测试结果
1

2 填写标题名称及内容
填写标题名称及内容 查看是否能上系统简介
上传后能否显示在首页 可以上系统简介

可以显示在首页 通过

通过
6.6本章小结
本章主要采用黑盒测试对各模块进行了完整的测试,经过分析测试过程和比较测试结果显示,系统各部分功能运行无异常。

结 论

为了保证系统的稳定性,这次采用的是一个比较常用的python语言开发。在学期末完成发展计划。本系统分为管理员和用户两部分。这两个部分紧密相连,有着独特的关系。最终成为影片数据爬取与数据分析的设计与实现。
在做需求分析,代码实现和功能测试的过程中遇到了很多自己解决不了的难题,比如,代码不明白,我查了CSDN,问了辅导老师,比如中英文不懂,我挨个去百度翻译查。这段时光虽然很苦很累,但也是我的精神最富有的一段时光。我真的理解先痛苦后幸福的含义。当我看到代码行和程序的雏形时,前面的痛苦仿佛一扫而光。通过这让我知道,无论发生什么,坚持最重要。有了这些经验,我将来会越来越好,在每一次实践中都会提高自己。

参考文献

[1] 韦力梅,苏兵. Django框架下Python网站开发过程综述 [J]. 电脑与电信, 2019.
[2] 李根.基于Django框架的生物信息网站建设[D] .大连海事大学,2018.
[3] 夏亚丽,戴志涛. 基于Django的O2O家庭酒店商务平台 [J]. 软件, 2019.
[4] 薛耀伟.基于Django框架管理界面自动生成模块的设计与实现[D].哈尔滨工业大学,2020.
[5] 陈勇.基于Django框架的实时课堂投票系统设计与实现[D].大连理工大学,2021.
[6] 周玥.基于Django框架的校园预约打印网站设计与实现[D].吉林大学,2019.
[7] 周吉波,孟利民. 基于Django web框架的GPS车载管理系统网站的设计和实现[C].第二届亚太地区信息论学术会议论文集,2019.
[8] Li,Shenliang,Si,Zhanjun. Information publishing system based on the framework of Django [J].Lect. Notes Electr. Eng.2019.
[9] Tiwari, Usha,Mehfuz, Shabana,Sharma, Satyam,Pandey, Vinayak Triguna. Design of Python Based Lost and Found Website for College Campus [J]. Int. Conf. Power Electron., Control Autom., ICPECA – Proc,2019.
[10] Suryanto,WiwitIrna,ka,Theodosius Marwan. Web-based application for inverting one-dimensional magnetotelluric data using Python [J].Comput. Geosci, 2018.

致 谢

经过几个月的努力,毕业设计终于完成了,这不仅提高了我的实践能力,也丰富了我的知识领域。在整个毕业设计过程中,他对我们非常友好,关心我们每个学生的选题,帮助我们分析哪些学生适合该学科,分析该学科的难度,并教我们如何处理可能出现的问题;在整个设计过程中,老师耐心地指导我,分析我的问题,帮助我找到解决方案。同时,在设计过程中,也得到了同学和室友的大力支持。他们帮助我查找信息并节省了宝贵的时间。
其次,我还要感谢在编程过程中帮助过我的同学们。 正是他们孜孜不倦的回答,才使物流管理系统的顺利建成。我还要感谢我的学校为我们提供了一个学习的地方和一个舒适的学习和生活环境。我要感谢我的导师对我的论文的客观评价。学校老师不遗余力地给我们上课和指导,让我们更好地掌握知识,提高处理实际问题的能力。因为老师的建议和指导对我的论文完成起了至关重要的作用。

这篇关于大数据分析django基于python的影片数据爬取与数据分析的论文的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/542411

相关文章

如何使用celery进行异步处理和定时任务(django)

《如何使用celery进行异步处理和定时任务(django)》文章介绍了Celery的基本概念、安装方法、如何使用Celery进行异步任务处理以及如何设置定时任务,通过Celery,可以在Web应用中... 目录一、celery的作用二、安装celery三、使用celery 异步执行任务四、使用celery

使用Python绘制蛇年春节祝福艺术图

《使用Python绘制蛇年春节祝福艺术图》:本文主要介绍如何使用Python的Matplotlib库绘制一幅富有创意的“蛇年有福”艺术图,这幅图结合了数字,蛇形,花朵等装饰,需要的可以参考下... 目录1. 绘图的基本概念2. 准备工作3. 实现代码解析3.1 设置绘图画布3.2 绘制数字“2025”3.3

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二

Redis事务与数据持久化方式

《Redis事务与数据持久化方式》该文档主要介绍了Redis事务和持久化机制,事务通过将多个命令打包执行,而持久化则通过快照(RDB)和追加式文件(AOF)两种方式将内存数据保存到磁盘,以防止数据丢失... 目录一、Redis 事务1.1 事务本质1.2 数据库事务与redis事务1.2.1 数据库事务1.

python使用watchdog实现文件资源监控

《python使用watchdog实现文件资源监控》watchdog支持跨平台文件资源监控,可以检测指定文件夹下文件及文件夹变动,下面我们来看看Python如何使用watchdog实现文件资源监控吧... python文件监控库watchdogs简介随着Python在各种应用领域中的广泛使用,其生态环境也

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链

Java调用Python代码的几种方法小结

《Java调用Python代码的几种方法小结》Python语言有丰富的系统管理、数据处理、统计类软件包,因此从java应用中调用Python代码的需求很常见、实用,本文介绍几种方法从java调用Pyt... 目录引言Java core使用ProcessBuilder使用Java脚本引擎总结引言python

python 字典d[k]中key不存在的解决方案

《python字典d[k]中key不存在的解决方案》本文主要介绍了在Python中处理字典键不存在时获取默认值的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录defaultdict:处理找不到的键的一个选择特殊方法__missing__有时候为了方便起见,

使用Python绘制可爱的招财猫

《使用Python绘制可爱的招财猫》招财猫,也被称为“幸运猫”,是一种象征财富和好运的吉祥物,经常出现在亚洲文化的商店、餐厅和家庭中,今天,我将带你用Python和matplotlib库从零开始绘制一... 目录1. 为什么选择用 python 绘制?2. 绘图的基本概念3. 实现代码解析3.1 设置绘图画

Python pyinstaller实现图形化打包工具

《Pythonpyinstaller实现图形化打包工具》:本文主要介绍一个使用PythonPYQT5制作的关于pyinstaller打包工具,代替传统的cmd黑窗口模式打包页面,实现更快捷方便的... 目录1.简介2.运行效果3.相关源码1.简介一个使用python PYQT5制作的关于pyinstall