
一、线性代数:机器学习的骨架系统
1.1 向量的本质与操作
向量是机器学习中最基础的数据容器,可视为具有方向和大小的数学对象。在三维空间中,向量v=(3,2,1)表示从原点指向坐标(3,2,1)的箭头。实际应用中,用户画像向量可能包含:[年龄=25, 身高=175cm, 月消费=5000元]。
关键运算:
- 点积运算:v·w = Σ(v_i * w_i) → 相似度计算的数学基础
- 范数计算:||v|| = √(Σv_i²) → 衡量向量长度的尺子
- 余弦相似度:cosθ = (v·w)/(||v|| ||w||) → 推荐系统的核心算法
示例:比较两篇文章的词频向量
v = [12,5,9](“算法”, “数据”, "模型"出现次数)
w = [8,7,15]
相似度得分:cosθ = (128+57+9*15)/(√(12²+5²+9²)*√(8²+7²+15²)) ≈ 0.89
1.2 矩阵:数据的关系网络
矩阵是二维数组的数学抽象,在图像处理中,一张1280x720的图片本质是包含921,600个元素的矩阵。推荐系统中,用户-商品评分矩阵是典型应用:
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



