- 博客(4)
- 收藏
- 关注
原创 聚类算法
聚类原理聚类是非监督学习里面最经典的算法了。其主要应用于市场营销的客户分层。聚类不仅很有效,而且其算法原理异常的简单。所谓聚类就是把各个属性最接近的那些样本点归为一类。而判断最近的方法一般和推荐算法的相似性一样,要么用距离法要么要相关系数法。层次聚类层次聚类是聚类算法的一种,其特点是不对聚类数目做任何假设。首先先找到所有样本点中最相近的两个点作为一类,并以这两个点的中心作为新的样本点的
2015-07-24 15:46:55
625
原创 推荐系统
推荐系统初探算法思路推荐系统应该算最简单的算法之一了,主要分为通过用户的购买信息来推荐商品和通过商品的被购买信息来推荐用户。以用户角度为例。首先要找到与该被推荐用户相似的一些用户并计算其相似度。然后找到那些该被推荐用户没有购买但与他相似的用户已经购买的一些商品。通过相似度给予这些不同的商品权重,然后求和得到各个商品可能购买的几率或者评分。以python为例具体程序按欧式距离法求相似度欧式距离显示的是
2015-07-17 16:53:34
1020
原创 scrapy爬虫基本应用
这段时间,终于大概把爬虫的体系完成。现在简单记录一下爬虫的流程。 我要用的工具有python+scrapy。先安装python和scrapy,最好用pip安装,安装scrapy后还要安装它依赖的一些module。 打开cmd,转到要保存的目录然后输入命令:scrapy startproject yourspidername 这个时候,scrapy就创建了init,items,pipelines,se
2015-07-13 22:02:36
585
原创 SAS一般语法
数据处理数据部的一般语法:data dataname;set datas;length v1 8. v2 $12. v3 $12.;v1=2;v2='snake';v3="my name is:"||v2; run;proc print;run;连接字符和字符变量用||。数据类型转换(input;put)主要是input把字符转数值,put把数值转字符。sas有自动转化功能但尽量自己定
2015-07-13 09:22:46
1739
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人