自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

清平乐的技术专栏

what we can do is keep moving

  • 博客(756)
  • 资源 (43)
  • 收藏
  • 关注

原创 金融业大数据应用场景

如果能够引入外部数据,还可以进一步加快数据价值的变现。外部数据中比较好的有社交数据、电商交易数据、移动大数据、运营商数据、工商司法数据、公安数据、教育数据和银联交易数据等。大数据在金融行业的应用范围较广,典型的案例有花旗银行利用 IBM 沃森电脑为财富管理客户推荐产品,并预测未来计算机推荐理财的市场将超过银行专业理财师;摩根大通银行利用决策树技术,降低了不良贷款率,转化了提前还款客户,一年为摩根...

2020-04-07 17:05:48 9257 3

原创 量化交易主流框架介绍

量化交易主流框架介绍talibtalib的简称是Technical Analysis Library,主要功能是计算行情数据的技术分析指标numpy介绍:一个用python实现的科学计算包。包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包s...

2018-10-15 19:16:46 6546 4

原创 Notepad++实现代码对比

总共分3步。

2025-05-15 11:52:20 667

原创 Notepad++常用操作(纯干货)

自定义快捷键:可以通过 Settings > Shortcut Mapper 来修改和设置快捷键。注意避免与系统或其他常用软件的快捷键冲突。

2025-05-15 11:40:03 598

原创 Hive SQL中 ?+.+ 的用法,字段剔除

.+ 的用法代表剔除表中的特定字段,建议按照字段顺序列出以确保正确性。

2025-03-26 11:52:29 390 1

原创 IT外包公司一览表

职场技巧

2025-03-19 10:32:55 146

原创 简道云学习—零代码开发平台

2015年就入局的零代码开发厂商,在数据管理与数据可视化分析上有出色表现。流程性应用配置需求,现也在挖掘核心应用需求的应用开发。作为无代码赛道的明星产品,在功能满足及使用体验上都较好。帆软软件出品,国内第一家在线零代码应用搭建平台,主打表单、流程表单、数据管理与数据分析,为企业流程性业务管理与配置赋能,无需代码、全程拖拽,即可完成应用搭建。

2025-03-14 17:00:40 333

原创 信息安全角度解析家用监控破解原理及防范

今天热搜看到一条新闻【民警建议家里不要安装摄像头】,今天借此来聊聊信息安全。当今这个时代,摄像头到处都是,这在维护治安等方面起到了相当重要的作用,不信你可以想一件事,这些年还见过打劫银行的吗?以前的港片,抢了金店,抢了银行,还能火拼一把再跑到东南亚。除了公共道路、公共场所摄像头到处都是,目前家用监控用的也越来越多。有的买官方正品的,有的去某多、某鱼买廉价商品,存在诸多风险。

2025-02-21 16:25:59 477

原创 硅基流动平台对接DeepSeek

硅基流动作为通用人工智能(AGI)基础设施领域的佼佼者,其一站式大模型 API 云服务平台 SiliconCloud,集成了通义大模型 Qwen2、智谱 AI旗下的 GLM-4、幻方量化旗下的 DeepSeek 系列开源模型等众多主流大模型,为开发者提供高效能、低成本的多品类 AI 模型服务,在 AI 领域早已声名远扬。硅基流动与DeepSeek的合作主要体现在技术支持和模型部署上。硅基流动在华为云的支撑下,成功上线了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1推理服务。

2025-02-20 11:31:25 1668

原创 从DeepSeek看当下AI应用场景

多邻国以AI为支撑,帮助学习链路个性化,同时结合贴近年轻人的趣味内容,以其独特的品牌风格占领用户心智,实现AI与口语训练的高效结合,驱动用户规模及业绩高增长。AI技术的赋能有望从编程、策划、美术、模型等多方面帮助游戏研发降本增效,例如在3D模型生成方面,腾讯混元3D AI创作引擎为普通UGC和游戏等专业场景提供了一站式3D内容生产的AI创作平台,支持搭建3D模型+3D功能矩阵+3D生成工作流+创作素材库一体的完整3D AI创作平台,借助3D AI创作平台可以高效的生成游戏所需的3D模型。

2025-02-18 15:47:40 890

原创 浅谈DeepSeek模型

2025 年 1 月 DeepSeek 发布的 R1 模型,性能比肩 OpenAI - o1 正式版,推理成本却大幅降低,瞬间成为全球焦点;用户增长呈井喷之势,短短 7 天便突破 1 亿用户大关。开源优势更是为 AI 应用研发成本 减负,加速 AI 应用在各领域全面开花。在影视、社交陪伴、电商、营销、教育、游戏等领域,AI 已经深度渗透,影视制作被重塑、社交陪伴添新趣、电商效率大提升…… 但前行之路并非坦途,AI 大模型发展与应用落地的不确定性,仍是亟待跨越的挑战。

2025-02-18 11:38:37 290 1

原创 一问读懂AI工具—DeepSeek、Kimi、豆包、文心一言、通义千问

随着AI时代的到来,AI早就百家争鸣,日新月异。我们常见AI有文心一言,通义千问,豆包,kimi这几款是相对好用的,而横空出世的deepseek AI却成为了海外最为热门人工智能体;deepseek以其开源、更快的算力成为了首选。

2025-02-18 11:25:35 2269

原创 jieba分词

除了cut方法外,jieba还提供了其他一些方法,如lcut、lcut_for_search等,可以根据具体需求选择使用。接下来,你可以使用jieba库的cut方法来进行分词。你可以通过调用jieba.load_userdict方法加载自定义词典,将其中的词语加入到分词词典中。jieba是一个简单易用的中文分词工具,通过使用它,你可以轻松地对中文文本进行分词处理,为后续的自然语言处理任务提供基础支持。其中,"userdict.txt"是自定义词典文件的路径,你可以在其中添加自己需要的词语。

2025-02-06 08:43:21 70

原创 Hive SQL 查询所有函数

对函数year进行详细解释,并举例说明。– 对函数year进行解释。

2024-12-19 16:54:51 495

原创 SQL实现百分数转小数格式

在上面的示例中,CAST(‘50%’ AS DECIMAL(4,2))将字符串’50%'转换为DECIMAL类型,并指定小数点位数为2。然后通过除以100将百分数转换为小数点格式。在MySQL中,可以使用CAST()函数将百分数转换为小数点格式。结果将是0.50,即表示50%的小数点格式。

2024-12-13 16:57:28 380

原创 数据库的码表

码表,也称作字典表或参考表,是一种数据库表,用于存储一组预定义的、标准化的数据。这些数据可以在其他表中被引用,以确保数据的一致性和完整性。码表通常包含两个主要字段:一个是主键(通常是代码),另一个是描述性字段(通常是名称或描述)。例如,在一个国家码表中,主键可能是国家代码,而描述性字段则是国家名称。通过使用预定义的值来确保数据的一致性。例如,在一个国家码表中,所有的国家名称和代码都是标准化的,避免了拼写错误和重复数据。通过引用码表中的值,可以确保数据的完整性。

2024-11-20 13:49:59 679 1

原创 SVN修改登录账号用户名

通过TortoiseSVN的clear Authentication Data和手动删除效果是一模一样的!都是对userName\Application Data\Subversion\auth\svn.simple\目录下的已保存登录用户信息文件进行删除。当再次用到svn时,会提示输入用户名密码,输入新的用户名密码即可。SVN安装后进行账号密码登录,如果要进行账号切换。

2024-10-18 14:08:28 1240

原创 Dbeaver设置显示字段备注注释

Dbeaver是免费和开源(GPL)为开发人员和数据库管理员通用数据库工具。注:版本不同可能目录结构有差异。(以下截图是另个版本的)Dbeaver如何设置显示字段注释?

2024-10-09 17:00:21 4993 1

原创 2024全球科技品牌价值榜50强:苹果第一

英伟达在人工智能芯片领域扮演着重要角色,其品牌价值大幅增长 163%,攀升至 445 亿美元,成为今年科技品牌中增长速度最快的一个,在全球最具价值的科技品牌排名中,英伟达的名次上升了 19 位,位列第 10 名。根据《Brand Finance 2024年全球最具价值科技品牌榜单报告》,中国品牌在社交媒体、电子和电器行业表现卓越。全球排名前三的是:苹果、微软以及 Google。国内前几的是:抖音、微信和华为,分为位于第五、十一、十五位。

2024-09-24 13:09:39 1280

原创 SQL求列表中最大值GREATEST() 函数

MySQL 中的 GREATEST() 函数用于返回一组值中的最大值。它接受多个参数,并返回这些参数中的最大值。此函数用于从列表中获取最大的数字。

2024-09-12 22:21:50 445

原创 Python更新数据库数据的三种方式(update+replace)

【代码】Python更新数据库数据的三种方式(update+replace)

2024-09-10 23:12:24 1335

原创 【永洪BI】动态设置组件显示和隐藏(脚本)

当有数据时显示预警提醒数据,没有数据时显示“无预警数据”2、写入脚本JavaScript。

2024-09-05 14:59:43 795

原创 2024 年 08 月编程语言排行榜

强大的库和框架:Python 拥有丰富的库和框架,如Django、Flask(Web开发)、NumPy、Pandas(数据分析)、TensorFlow、PyTorch(机器学习)等,这些工具极大地提高了开发效率。今天的 Python(尤其是 Python 3.x)已经成为一种广泛使用的编程语言,广泛应用于 web 开发、数据科学、人工智能、自动化等领域。Python 3.0:2008 年发布,虽然与 Python 2.x 不完全兼容,但引入了许多重大改进,如更一致的字符串处理和新的标准库。

2024-08-09 11:58:25 1689 1

原创 BI行业(商业智能)竞争格局分析

从商业智能行业现有竞争者情况来看,市场份额多集中于头部厂商,参与者众多,竞争较为激烈;由于多数商业智能参与者具有一定的技术实力,且在构建信息技术底座上具有一定的基础,因此厂商具备承担部分上游工作的能力,因此供应商的议价能力一般;由于消费者可选择的商业智能软件较多,且部分具有技术实力的厂商具备自主开发的能力,因此消费者议价能力尚可;由于商业智能行业技术壁垒和资金壁垒较高,且行业内部竞争激烈,因此进入者威胁相对较小;

2024-07-17 11:22:14 760

原创 Windows长截屏工具VeryCapture(免费、免注册、无水印)

VeryCapture是一款功能全面、操作简便的屏幕捕获工具,它不仅支持常规的截屏功能,还包括了录屏、OCR文字识别、翻译、GIF制作等多项实用功能。该软件适用于Windows操作系统,旨在为用户提供一站式的屏幕捕捉解决方案。

2024-07-08 16:21:41 2241 4

原创 JavaScript主要用途和方向

JavaScript是一种广泛使用的编程语言,可以用于开发各种类型的应用程序,包括Web应用程序、桌面应用程序、移动应用程序和游戏等。

2024-07-05 14:12:11 740

原创 IT专业入门,高考假期预习指南—初识产品经理BRD、MRD 和 PRD

BRD—MRD—PRD是一个从高到底的逐层递进的关系,BRD从战略高度告诉我们做什么产品,MRD从战术的角度告诉我们怎么做,PRD非常细化的告诉我们做成什么样!BRD决定了产品的商业价值PRD决定了项目质量水平MRD在中间起到一个承上启下的作用,质量好坏直接影响到产品项目的开展,并直接影响到公司产品战略意图的实现。PRD、BRD和MRD,一起被认为是从市场到产品需要建立的文档规范。

2024-07-03 09:23:36 1018

原创 Python requests模块

Python中的requests是第三方模块用于实现HTTP请求,该模块在实现 HTTP请求时要比Python语言内置的 urllib 模块简化很多,操作更加人性化。在 Windows系统下使用requests 模块时需要通过在命令行窗口中执行代码进行安装。

2024-07-02 14:28:10 679

原创 Python: 送你一朵小红花

【代码】Python: 送你一朵小红花。

2024-07-01 14:58:43 347

原创 Python: 送你一颗心

【代码】Python: 送你一颗心。

2024-07-01 14:54:18 180

原创 Python 获取字典中的值(八种方法)

Python 字典(dictionary)是一种可变容器模型,可以存储任意数量的任意类型的数据。字典通常用于存储键值对,每个元素由一个键(key)和一个值(value)组成,键和值之间用冒号分隔。

2024-07-01 11:57:34 26826 4

原创 Python 报错 Max retries exceeded with url 解决方案

默认的http connection是keep-alive的,在post请求中,header中有这样一个字段:Connection,我们将其置为’close’requests使用了urllib3库,默认的http connection是keep-alive的,requests设置False关闭。

2024-06-26 14:17:37 4027

原创 Python处理JSON数据

JSON(JavaScript Object Notation)是一种数据格式,它是一种轻量级的数据交换格式,易于人们阅读和编写,同时也易于机器解析和生成,目前广泛应用于Web应用程序中。JSON的格式具有以下特点:轻量级:相比XML格式,JSON格式的体积更小,传输速度更快。易于阅读和编写:JSON格式采用了类似于JavaScript语言中的对象和数组的数据结构,易于人们阅读和编写。易于机器解析和生成:JSON格式可以通过常规的JavaScript JSON解析器来解析和实现。

2024-06-25 00:13:41 446

原创 由浅入深,玩转Python列表推导式

列表推导式提供了从序列创建列表的简单途径。通常应用程序将一些操作应用于某个序列的每个元素,用其获得的结果作为生成新列表的元素,或者根据确定的判定条件创建子序列。如果希望表达式推导出一个元组,就必须使用括号。

2024-06-25 00:06:27 358

原创 2024高考-优先选专业还是优先选学校

如:专业——学校——地域——职业,再根据孩子其他方面的个人喜好,进行优选,最后,按照志愿表的要求,排列出学校的顺序和专业的顺序即可。因为,社会上用人单位对毕业学校的评价,实际是有等级标准的,在招聘时,经常会有单位对毕业学校有硬性要求,越是人人都向往的单位,越是如此。俗话说,高考“三分考,七分报”,其实先选大学,还是先选专业。以上均是个人观点,仅供大家参考,如果正在阅读你恰好是今年2024高考的考生,祝愿你有一个美好的前程,报考顺利~。这样的考生,什么学科成绩都不突出,没有最强的,也没有最差的。

2024-06-20 13:52:21 743

原创 Python 显示当前时间

U 一年中的星期数(00-53)星期天为星期的开始。%W 一年中的星期数(00-53)星期一为星期的开始。%Y 四位数的年份表示(000-9999)%w 星期(0-6),星期天为星期的开始。%y 两位数的年份表示(00-99)%I 12小时制小时数(01-12)%p 本地A.M.或P.M.的等价符。%c 本地相应的日期表示和时间表示。%j 年内的一天(001-366)%d 月内中的一天(0-31)%m 月份(01-12)%B 本地完整的月份名称。%x 本地相应的日期表示。%X 本地相应的时间表示。

2024-06-20 11:48:27 1004

原创 Python获取元组中元素方法(七种方式)

在Python中,你可以通过索引来获取元组中的值。元组是一种不可变的序列类型,所以你不能更改元组中的元素,但可以访问它们。本文主要介绍一些获取元组中值的方法:

2024-06-20 11:40:34 6663 2

原创 Python 列表添加多个值(四种方法)

Python 中列表对象有一个 extend() 方法,它可以一次性添加另一个列表中的所有元素到当前列表中。通过 + 运算符可以实现列表的合并,将列表 a 和列表 b 合并成了一个新列表 c。

2024-06-19 13:12:14 1573

原创 Python 列表添加多个值(四种方法)

Python 列表添加多个值。

2024-06-19 10:51:39 777

原创 Python实现base64加密/解密

【代码】Python实现base64加密/解密。

2024-06-12 13:43:16 1334

HiveSQL开发指南2021.rar

介绍HiveSQL的相关知识和常用开发代码,实用、便捷。密码qingpingyue01,欢迎下载

2021-12-06

Airflow安装配置和web端插件安装

网络中关于airflow的资料比较少,这里做了一下整理: 1.整理centos7中airflow的安装配置 2.原生airflow默认不支持web端的拖拽实现dag,需要写python脚本,这里我做了一个插件安装说明,可以从网页端实现dag的编写

2020-07-01

数仓规范文档.rar

本文档整理数据仓库搭建过程中的分层结构和数据库、表名、字段命名规范,对数仓开发、大数据开发有重要帮助,欢迎下载。有问题随时博客留言或者私信我。

2020-05-30

navicat 连接oracle 11g驱动包

我的Navicat 版本是Navicat Premium 12 ,最近在windows环境中远程连接新项目的Oracle(11g版本)连接报错。我在之前项目中连接Oracle12是不报错的,也不需要做任何配置,直接选择basic或者TNS连接方式都可以顺利连接,刚开始也很恼火,查了资料后,加载这个驱动就行,最终解决,这里面还有连接hive和mysql的,大家也可以存一下

2020-05-28

陀螺仪调度部署和使用(美云智数).rar

整理美云智数调度工具部署和使用。美云智数,源自于财富世界500强企业美的集团信息科技,基于先进企业的业务实践,把管理实践软件产品化,为大中型企业提供智能制造、大数据、数字营销、移动办公、身份管理、财务与人力、IT咨询等领域的云产品与解决方案。

2020-05-14

azkaban安装包(web+excutor)

zkaban是一个Hadoop workflow定时调度工具,它解决了多个Hadoop任务单元之间的前后依赖关系。它提供了十分友好的用户界面,使用简单,容易上手。这里为大家提供azkaban2.5调度工具的全套安装包,具体安装步骤可以参考我的博客

2020-03-27

集群搭建手册_CDH5.13.1版.docx

整理企业级Hadoop_CDH集群的搭建步骤和常见问题解决方案,包括环境配置,安装步骤和使用方法,最后将搭建过程中的常见错误做了总结和解释

2020-03-11

TensorFlow.xmind

整理python机器学习常用算法,里面涵盖基础操作,案例解析和注意事项,包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机,TensorFlow等,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day10-决策树与贝叶斯.xmind

整理python机器学习常用算法,里面涵盖基础操作,案例解析和注意事项,包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机、决策树、贝叶斯等,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day9-LinearRegression线性回归与逻辑斯蒂回归.xmind

整理python机器学习常用算法,里面涵盖基础操作,案例解析和注意事项,包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机等,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day8-KNN.xmind

整理python机器学习常用算法,里面涵盖基础操作,案例解析和注意事项,包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机等,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day7-pandas-Ⅳ:数据加载与透视表.xmind

整理python数据分析库的重要知识,包括ipython、numpy、pandas(重要,包括3个文档)、scipy包、matplotlib图形绘制,共计7个文档,里面涵盖基础操作,案例解析和注意事项,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day6-matplotlib.xmind

整理python数据分析库的重要知识,包括ipython、numpy、pandas(重要,包括3个文档)、scipy包、matplotlib图形绘制,共计7个文档,里面涵盖基础操作,案例解析和注意事项,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day5-Scipy.xmind

整理python数据分析库的重要知识,包括ipython、numpy、pandas(重要,包括3个文档)、scipy包、matplotlib图形绘制,共计7个文档,里面涵盖基础操作,案例解析和注意事项,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day4-pandas-Ⅲ.xmind

整理python数据分析库的重要知识,包括ipython、numpy、pandas(重要,包括3个文档)、scipy包、matplotlib图形绘制,共计7个文档,里面涵盖基础操作,案例解析和注意事项,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day3-pandas-Ⅱ.xmind

整理python数据分析库的重要知识,包括ipython、numpy、pandas(重要,包括3个文档)、scipy包、matplotlib图形绘制,共计7个文档,里面涵盖基础操作,案例解析和注意事项,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day2-pandas-Ⅰ.xmind

整理python数据分析库的重要知识,包括ipython、numpy、pandas(重要,包括3个文档)、scipy包、matplotlib图形绘制,共计7个文档,里面涵盖基础操作,案例解析和注意事项,因不能同时上传多个文件,所以逐一上传,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

Day1-IPython与Numpy.xmind

整理python数据分析库的重要知识,包括ipython、numpy、pandas(重要,包括3个文档)、scipy包、matplotlib图形绘制,共计7个文档,里面涵盖基础操作,案例解析和注意事项,如果下载文档的博友有问题可以随时咨询我,保证物有所值

2020-01-13

115个Java面试题和答案——终极(下)_ (1).pdf

资料包含115道java常考面试题,共分为两个文档分为上下两册,内容来自北京著名iT培训机构,实战性强,欢迎下载!

2019-06-29

115个Java面试题和答案——终极(上).pdf

资料包含115道java常考面试题,共分为两个文档分为上下两册,内容来自北京著名iT培训机构,实战性强,欢迎下载!

2019-06-29

机器学习06--线性回归

回归的目的是预测数值型的⽬目标值。最直接的办法是依据输入写出一个目标值的计算公式

2018-11-08

机器学习05--朴素贝叶斯

朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。

2018-11-08

机器学习09--决策树02

ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树。从根结点(root node)开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不不同取值建立子节点;再对子结点递归地调用以上方法,构建决策树;直到所有特征的信息增益均很小或没有特征可以选择为⽌止,最后得到一个决策树。

2018-11-08

机器学习03--决策树01

决策树(decision tree)是⼀一种基本的分类与回归方法。流程图就是⼀一个决策树,长方形代表判断模块(decision block),椭圆形成代表终⽌止模块 (terminating block),表示已经得出结论,可以终止运行行。从判断模块引出的左右箭头称作为分支(branch),它可以达到另一个判断模块或者终⽌止模块。

2018-11-08

机器学习03--sklearn手写数字识别

Scikit learn 也简称sklearn,是机器器学习领域的python模块,sklearn包含了了很多机器器学习的方式

2018-11-08

机器学习02--K近邻算法

k近邻法(k-nearest neighbor, k-NN)是1967年年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理理是:存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据 后,将新的数据的每个特征与样本集中数据对应的特征进⾏行行⽐比较,然后算法提取样本最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类。

2018-11-08

机器学习01--机器学习入门知识(数据科学 5 机器学习介绍)

何谓机器器学习就是把无序的数据转换成有⽤用的信息,海海量量数据抽取有价值的信息。创建并使用那些由学习数据⽽而得出的模型,预测建模或数据挖掘。用已存在的数据来开发可⽤用来对新数据预测多种可能结果的模型。第一个文档让大家对机器学习有个初步认识

2018-11-08

数据分析--matplotlib绘图和可视化

信息可视化(也叫绘图)是数据分析中最重要的工作之一。它可能是探索过程的一部分,例如,帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。另外,做一个可交互的数据可视化也许是工作的最终目标。matplotlib是一个用于创建出版质量量图表的桌⾯面绘图包(主要是2D方面)。

2018-11-08

MySQL性能优化之参数配置

mysql性能优化的配置过程,back_log值指出在MySQL暂时停⽌止回答新请求之前的短时间内多少个请求可以被存在堆栈中。也就是说,如果MySql的连接数据达到max_connections时,新来的请求将会被存在堆栈中,以等待某一连接释放资源,该堆栈的数量量即back_log,如果等待连接的数量量超过back_log,将不不被授予连接资源。

2018-11-08

机器学习面试题目1

python高级的知识点,包括当下的机器学习见面试题,这里做了3份,分别上传给大家,基本涉及到了相关要点,希望对大家有用

2018-10-18

python面试笔试题(现场应聘收集)

题目都是照片格式的,都是面试python的同事和朋友提供,我统一整理的,题目类型涉及多方面,因为是面试所以拍摄角度有的会有点偏差,有需要的可以下载希望对大家有用!

2018-10-18

笨办法学python

《笨办法学 Python》(Learn Python The Hard Way,简称 LPTHW)是 Zed Shaw 编写的一本Python 入门书籍。适合对计算机了解不多,没有学过编程,但对编程感兴趣的朋友学习使用。这本书以习题的方式引导读者一步一步学习编程,从简单的打印一直讲到完整项目的实现。也许读完这本书并不意味着你已经学会了编程,但至少你会对编程语言以及编程这个行业有一个初步的了解。

2018-10-18

大数据分析---数据规整:聚合和重塑

在许多应⽤用中,数据可能分散在许多文件或数据库中,存储的形式也不不利利于分析,应采用聚合、合并、重塑数据的⽅方法进⾏行行处理理。

2018-10-09

大数据分析--数据清洗和准备

在数据分析和建模的过程中,相当多的时间要用在数据准备上:加载、清理理、转换以及重塑。这些工作会占到分析师时间的80%或更更多。

2018-10-09

大数据分析--数据加载、存储

pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read_table用得最多

2018-10-09

大数据分析---Pandas使用

pandas和Numpy还是有区别,这里主要包括两个主要数据结构:Series和DataFrame

2018-10-09

数据分析2--NumPy

由浅入深交给你如何用python实现大数据开发和人工智能

2018-09-25

数据分析1--认识大数据工具

数据分析是人工智能的必备知识,算法、数据结构都要很高的要求,这些文档由浅入深给大家提供数据分析的知识,总共10个文档,后续会陆续更新

2018-09-25

Diango从基础到高级

Django框架的基础回顾以及高级应用,共三个文档,上传了一个重要的,这里不能设置免费分数,另外两个下载的朋友免费邮箱发送不单独上传了

2018-09-19

Python面试题整理

整理的python面试题目,后续会继续整理BAT的面试100题,下载的朋友后续免费发送

2018-09-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除