PyTorch 体验感悟

mikewzp

已于 2022-09-22 14:58:00 修改

阅读量2k

点赞数

分类专栏：研发管理文章标签：深度学习 python pytorch

于 2022-03-20 16:03:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mikewzp/article/details/123614894

版权

研发管理专栏收录该内容

7 篇文章

订阅专栏

本文比较了Pytorch与Tensorflow在张量传递、模型架构、参数传递方式上的区别，Pytorch强调灵活性与所见即所得，而Tensorflow注重封装与工业化标准。讨论了各自的设计理念及其优劣，以及Pytorch在模型定制上的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先，它的张量传递确实更灵活、可以自由变形。这点tensorflow1.0哪怕借用了Keras，也不能随意调换（如Batch)

然后说一下Pytorch的特点：

在模型架构上，虽然两者都有许多共同的函数方法：Conv2D, Sequential, Batchnorm1d, Flatten, Relu, Softmax。前者在nn.LSTM，后者在keras.models。用法也大同小异，但是在传递参数上需要指定输入维度，而tensorflow仅告诉输出维度就行。看似小的不同，却能反映出设计理念上的差异：在都带给人方便的前提下，Pytorch是注重灵活，每一层设定好（input_channel, out_channel, kernel, stride, padding)各个参数，使得一切是按照模型定义搭建；而tensorflow则是作为工业化标准，更为强调封装，一些能省的参数（即可以自行计算出的：比如input_channel）就无需提供，整个模型作为图流动起来。
那么这种设计会带来什么好处呢？可以说，Pytorch实现了模型定义的所见即所得，想设计成什么样就可以实现成什么样。只要你能够把思路理清楚，把代码敲出来。因为它除了定义好接口之外，所有的调用、训练与测试都是你说了算，也就是每一步都需要自行编码实现：包括优化器的定义与监控，并根据选取的Epoch进行迭代，各种集合的划分（训练、验证、测试）。是不是一切尽在掌控^_^
正是理念的缘故，当初我想找一个Dense，结果发现网上根本没有tensorflow版；可以自己实现的代码有，但库里不带。觉得奇怪怎么会没有呢？原来是因为这种风格，请指定dense(第一维，第二维）。其实与卷积需要指定输入通道，批正则需要指定作用维度是一个道理。而对于Tensorflow，它的封装非常的好基本上调用个model.fit(X, y)就能行，里面包含了各种可视化与调控工具。构建模型有函数式和类型实例化两种，而Pytorch主要就是通过类去进行构建。

好了，说了这么多，个人认为Pytorch赋予了按照自己的思路去组建模型的能力，想要快速上手去面向对象，就可以尝试，祝使用顺利:D

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。