- 博客(141)
- 收藏
- 关注
原创 旅游网站大数据分析 - 数据抓取
第1关:利用Jsoup抓取携程旅游网的数据代码第2关:解析并提取HTML 元素(一)代码第3关:解析并提取HTML 元素(二)代码第4关:使用Jsoup抓取携程旅游网全国城市信息
2025-04-28 23:53:28
691
原创 旅游网站之数据可视化
第1关:词云的绘制任务描述本关任务:使用KUMO框架绘制一个简单的词云。第2关:词云的渲染任务描述本关任务:将第一关生成的词云进行渲染,生成一个更好看直观的词云。第3关:获取酒店评论数据生成词云任务描述本关任务:使用上一章节数据分析-酒店评论词频数据生成词云。
2025-04-28 18:58:12
1037
原创 旅游网站大数据分析 - 数据存储
第1关:保存酒店和城市数据任务描述本关任务:从文件aomen.txt、hongkong.txt中获取酒店和城市数据,保存到Hbase中。第2关:保存酒店评论信息任务描述本关任务:从comment.txt文件中获取酒店评论数据,并保存到Hbase中相关知识为了完成本关任务,你需要掌握:如何创建Hbase表如何存储到Hbase了解酒店评论数据的文件格式如何读取文件如何创建Hbase表com.util.HBaseUtil类封装了对应的创建Hbase表方法createTable
2025-04-28 18:44:00
735
原创 酒店智能推荐---智慧旅游
第1关:构建用户-酒店矩阵任务描述本关任务:编写Python代码,实现用户-酒店矩阵的构建。第2关:酒店智能推荐任务描述本关任务:编写Python代码,实现酒店智能推荐。
2025-04-28 18:39:50
748
原创 旅游网站大数据分析 - 数据清洗
第1关:清洗HTML文档中无意义数据任务描述将获取到携程网的城市酒店的HTML数据(包含了所有元素)进行清洗,得到我们需要的标签数据。第2关:获取携程网北京市的所有酒店信息任务描述本关任务:获取携程网北京市酒店的所有信息。
2025-04-28 18:32:16
903
原创 旅游网站之数据分析
第1关:统计每个城市的宾馆平均价格任务描述本关任务:使用Hbase的MapReduce对酒店和城市数据进行分析,统计每个城市的酒店平均价格,其中酒店和城市数据已经存储在Hbase的t_city_hotels_info表中(表结构可在编程要求中进行查看)。第2关:统计酒店评论中词频较高的词任务描述本关任务:使用Hbase的MapReduce对酒店评论数据进行分析,统计香港某酒店评论中词频出现较高的词,其中酒店数据已存储在Hbase的t_hotel_comment表中。
2025-04-28 18:29:22
1007
原创 中医证型关联规则挖掘
目前,应用中医药治疗恶性肿瘤已成为公认的综合治疗方法之一,且中医药治疗乳腺癌有着广泛的适应证和独特的优势。从整体出发,调整机体气血、阴阳、脏腑功能的平衡,根据不同的临床证候进行辩证论治。确定“先证而治”的方向:即后续证候尚未出现之前,需要截断恶化病情的哪些后续证候。发现中医症状间的关联关系和诸多症状间的规律性,并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。
2025-04-28 00:53:27
958
原创 Python 计算思维训练——数组计算与曲线绘制
第1关:绘图函数 - 绘制 sin 函数代码第2关:绘图与保存 - 抛物线函数曲线代码第3关:数组计算与向量化处理 - 函数曲线绘制与坐代码第4关:图例与坐标设置 - 绘制多条曲线代码第5关:向量化处理 - 绘制函数图形代码
2025-04-28 00:33:34
650
原创 Python 计算思维训练——绘图进阶
第1关:柱状图 - 商品房销售价格统计图代码第2关:并列柱状图 - 商品房销售价格统计图代码第3关:饼状图 - 2010 全国人口普查数据分析代码第4关:多子图绘制 - 2010 全国人口普查数据分析代码
2025-04-28 00:27:04
1025
原创 电商精准营销—购买意向预测
任务描述本关任务:根据要求,建立随机森林模型。相关知识为了完成本关任务,你需要掌握:1.理解随机森林模型的原理,确定随机森林的树的个数;2.使用 sklearn 包搭建随机森林模型。随机森林随机森林分类的思想简单来说是这样的,对于分类问题来说,一棵分类的决策树的预测效果不好,那么就采用多棵树来进行分类,然后采用投票的方法。比如对于二分类问题来说,有 25 课树,其中 13 课判定为正类,12 课判断为负类,最终判断为正类。具体来说,传统的决策树在选择划分属性时,是在当前结点的属性集合(假设
2025-04-28 00:19:49
1025
原创 第4章 类与对象
声明一个CPU类,包含等级(rank)、频率(frequency)、电压(voltage)等属性,有两个公有成员函数run、stop。其中,rank 为枚举类型CPU_Rank,声明为enum CPU_Rank {P1=1,P2,P3,P4,P5,P6,P7},frequency为单位是MHz 的整型数,voltage 为浮点型的电压值。观察构造函数和析构函数的调用顺序。
2025-04-26 15:25:54
811
原创 第6章 数组、指针与字符串
本关任务:编写一个 Employee 类,录入与打印姓名、地址、城市和邮编信息,修改姓名,再次打印信息,并测试观察类对象与指针的内容。注:单个字段不包含空格。
2025-04-26 15:23:09
811
原创 第5章 C++程序的结构
第1关:运行下面的程序,观察变量x、y的值任务描述观察程序运行中变量的作用域、生存期和可见性;第2关:实现客户机(CLIENT)类任务描述实现客户机(CLIENT)类。声明字符型静态数据成员ServerName,保存其服务器名称;整型静态数据成员ClientNum,记录已定义的客户数量;定义静态函数ChangeServerName()改变服务器名称。
2025-04-26 15:18:40
599
原创 第3章 函数
第1关:华氏温度转摄氏温度任务描述编写一个函数把华氏温度转换为摄氏温度,转换公式为:C = (F - 32) * 5/9。相关知识为了你能够更好的完成本关任务,你需要掌握函数的定义;函数的调用。
2025-04-26 15:14:12
684
原创 数据清洗基础
第1关:读CSV文件任务描述本关任务:了解不同的编码格式。第2关:清洗列名任务描述本关任务:学会如何对列名进行清洗。第3关:清洗列名(续)任务描述本关任务:继续清洗列名。第4关:将字符串列转换为数值列第5关:删除非数字字符任务描述在上一个练习中,我们在ram列中确定了一个清晰的模式——所有的值都是整数,字符串末尾包含字符GB:第6关:将列转换为数字类型第7关:列的重命名任务描述现在我们已经将列转换为数字类型,最后一步是对列进行重命名。这是一个可选步骤,如果非数字值包含有助于我们理解数据
2025-04-22 17:10:33
1609
原创 美国教育数据分析
第1关:认识数据任务描述本关任务:使用python查看数据属性名称。代码第2关:数据预处理任务描述本关任务:使用sklearn填补数据缺失值,并进行标准化。代码第3关:数学成绩预测任务描述本关任务:使用sklearn对教育数据中数学成绩分数进行预测。代码
2025-04-22 16:42:21
904
原创 数据清洗——大数据与数据挖掘技术
第1关:数据去重任务描述利用pandas命令去除csv文件中重复的数据。第2关:处理空值任务描述在收集数据的过程中,可能会有一些空行或空项。有空值的数据不经过处理,通常是不可以直接使用的。本关卡将使用pandas查找数据集中的空值,并对空值进行处理。
2025-04-22 16:38:32
911
原创 Java面向对象程序设计——练习2
练习-Java继承和多态之方法重写练习-Java继承和多态之接口练习-Java继承和多态之综合练习练习-Java异常处理之try-catch之异常捕获练习-Java继承和多态之abstract类
2025-04-22 11:00:37
936
原创 Java面向对象程序设计——练习
练习-Java字符串之String类常用方法之统计一个字符串里面另一个字符串出现的次数练习-Java类和对象之类的声明之复数运算学习-Java类和对象之对象组合之求圆柱体积练习-Java类和对象之对象数组
2025-04-22 10:52:05
738
原创 Java面向对象程序设计-实验1Java入门
/按照任务要求,定义不同的变量,分别输出,查看结果,总结不同变量的应用。//此线上任务完成后,再将此程序在idea环境中运行,并改变数值与类型,体会不同数据类型的范围与区别。char c='a';String S="这是字符串类数据类型";System.out.println("字节型变量 b = "+b);System.out.println("短整型变量 s = "+s);System.out.println(" 整型变量 i = "+i);
2025-04-20 13:51:43
139
原创 Java面向对象程序设计-实验7 接口的应用
任务要求: 按照注释要求,完成类的设计 根据本案例接口的设计,可继续在idea环境中,进行程序的扩展,如面对接口Swimable,在主类中添加方法:flyInAir(Flyable fly),swimInWater(Swimable swim)等。说明:利用接口实现不同事件的不同行为,体会接口与抽象类的区别。利用接口实现:广告牌展示不同公司的广告。用接口展示不同国家的问候语。用接口展示不同品牌的产品。思考面向接口编程的好处。
2025-04-20 13:47:17
194
原创 Java面向对象程序设计-实验6 组合与继承
本关任务: 构建类关系:Professor类继承Employee类,Employee类继承Person类;说明: 练习巩固组合关联关系与抽象类的应用,组合与继承关系综合应用 本关任务: 根据不同的二维图形的底,计算其面积。本关任务:练习体会类之间的组合关系:SIM卡类与MobilePhone类的组合关系,使得卡与手机之间实现了松耦合。说明:练习巩固抽象类的应用、对象数组的应用等 本关任务: 根据不同的形状,计算其面积,并输出。说明:练习巩固类的继承关系,,理解向上转型,体会多态的应用与意义。
2025-04-20 13:30:48
400
原创 我的创作纪念日
从那以后,我开始把日常学习中的笔记、项目里的实战经验转化为文章,希望用通俗易懂的语言,让更多人少走弯路 —— 这便是初心,像一个技术路上的「拾穗者」,把散落的思考收集成照亮他人的星火。在掘金直播分享 MySQL 索引优化时,有观众发来私信说「按照你的方法排查出了公司慢查询问题」,这种跨越屏幕的共鸣,让技术不再是冰冷的代码,而是充满温度的协作。:从后端开发向「全链路架构师」转型,深入云原生、Serverless 等领域,主导至少 1 个千万级流量的分布式系统设计,用技术解决真实世界的复杂问题。
2025-04-13 01:22:50
544
原创 JAVA 单例模式实验
任务描述在企业网站后台系统中,一般会将网站统计单元进行独立设计,比如登录人数的统计、IP 数量的计数等。在这类需要完成全局统计的过程中,就会用到单例模式,即整个系统只需要拥有一个计数的全局对象。本关任务:模拟网站登录,高并发场景。模拟 10 个登录线程,程序输出登录总数。
2025-03-25 17:32:56
179
原创 JAVA 原型模式实验
第1关:浅克隆任务描述某高校自行开发了一套教务系统,但在使用过程中,越来越多的老师对教学周历的创建和编写模块产生了抱怨。追其原因,该高校的教务管理员发现,同一门课程会有多个班级,教师需要对每个班级都要录入教学周历,然后这些周历大多是完全一致的,只有细微的差别。但是现行系统每个班级默认创建的周历都是空白报表,老师只能通过重新输入或不断复制粘贴来填写重复的内容,极大降低了工作效率,浪费宝贵的时间。那么如何快速创建相同或者相似的教学周历呢 ?
2025-03-25 17:26:48
1061
原创 JAVA 建筑者模式实验
第1关:建筑者模式任务描述有一个虚拟仿真的应用程序,需求适配大部分用户群体,且能给不同用户带来不一样的视觉体验。因此要求系统自动检测用户机器配置,以此来动态产生场景中树叶(leaf)、房子(house)、路面(way)不同的渲染效果。
2025-03-25 17:20:23
351
原创 JAVA 工厂模式实验1-3
JAVA 工厂模式实验1-3第1关:简单工厂模式本关任务:某电视机厂专为各知名电视机品牌代工生产各类电视机,当需要海尔牌电视机时只需要在调用该工厂的工厂方法时传入参数“Haier”,需要海信电视机时只需要传入参数“Hisense”,工厂可以根据传入的不同参数返回不同品牌的电视机。现使用简单工厂模式来模拟,程序将会自动从配置文件中读取参数,请根据以下类图来补全代码。
2025-03-04 19:32:20
1319
原创 JAVA 面向对象设计原则实验
任务描述有一个智慧养鸡场,需要很多类型的采集设备,每种设备都有登录和采集两个方法,但是每种设备的采集的规则又不太相同。最开始养殖场只有 MML 类型的设备,开发人员很快就搭建好了采集系统。但过了一年,养殖场购买了 TELNET 类型设备替换原有设备,这时开发人员发现一个问题,原先的系统修改起来很麻烦,为降低维护成本,他们重新设计了系统框架编程要求根据提示,在右侧编辑器 Begin-End 内补充“IDevice、DeviceMML、DeviceTELNET、DeviceService”文件的代码。
2025-03-04 19:27:31
571
原创 头歌——C++类的多态性与虚函数
人与复读机任务描述本关任务:设计人类、英语学生类和复读机类三个类。相关知识为了完成完成本关任务,你需要掌握虚函数的基本使用。多态性在面向对象的方法中,多态性是指向不同对象发送同一个消息,不同对象在接收时会产生不同的行为(方法)。通俗点说就是可以不用像 C 语言中为了求多种图形的面积而针对不同的图形各设计一个独立名字的函数,在 C++ 中只要设计一个专门用于求面积的函数名即可。这个专门用于求面积的函数名可以作为各种求图形面积的函数名。这么做的好处在于程序设计者可以省去设立多个函数名对应
2025-01-04 22:34:33
675
原创 头歌——C++继承与派生
本关任务:把描述直角坐标系上的一个点的类作为基类,派生出描述一条直线的类和描述一个三角形的类。定义成员函数求出两点间的距离和三角形的面积。 提示:先定义描述点的类 Point;类 Point 的派生类 Line 为直线类,一直线有两个端点,所以它在点类的基础上新增一组点的坐标(x2,y2);三角形类 T 在直线的基础上再新增一组点的坐标(x3,y3),求出三角形的面积。
2024-12-30 16:06:33
1337
原创 头歌——C++实验09 类与对象
创建一个类Point用来表示平面上的一个点,包含数据成员x和y,表示坐标,类型为double,并包含以下成员函数: void set(double a, double b);//设置成员值 void print( );// 输出成员值,形式为:(x, y) double xOffset( );// 返回x的值 double yOffset( );// 返回y的值 double distance( );// 返回坐标到原点的距离在头文件Point.h中添加类定义,在源文件Point.cpp中添加类实现。
2024-12-30 16:01:00
296
原创 头歌——C++实验08 引用和结构体
任务创建函数,通过引用修改结构体成员你的任务是:使用传入的引用,更新student结构体实例中的name和age字段提示:main函数已经存在,不需要返回值,直接在原结构体上修改即可
2024-12-30 15:57:33
290
原创 头歌——C++指针
编写一个C++函数,该函数接受两个字符串指针作为参数,并实现对这两个字符串进行比较的功能。根据比较结果,返回一个整数值以表示两个字符串之间的关系:返回0表示相等,小于0表示第一个字符串小于第二个字符串,大于0表示第一个字符串大于第二个字符串。以字符在ASCII表中的值决定字符的大小关系。
2024-12-30 15:55:12
634
全网最全【计算机网络】课件+课本+学习笔记+知识总结
2024-06-09
数据结构与算法课程设计:不同路径
2024-05-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人