Python图片识别脚本：从零开始实现图像识别！

最新推荐文章于 2025-04-18 23:36:48 发布

Python_trys

最新推荐文章于 2025-04-18 23:36:48 发布

阅读量1.1k

点赞数 6

文章标签： python 开发语言编程 Python入门 Python基础 Python识别 Python学习

本文链接：https://blog.csdn.net/Python_trys/article/details/146072806

版权

包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】

图像识别是计算机视觉领域的一个重要应用，Python凭借其丰富的库和工具，成为了实现图像识别的首选语言之一。本文将带你从零开始，使用Python编写一个简单的图片识别脚本。我们将使用OpenCV和TensorFlow来实现这个功能。

1. 环境准备
在开始之前，我们需要安装一些必要的Python库。你可以使用pip来安装这些库：

pip install opencv-python
pip install tensorflow
pip install numpy

OpenCV：用于图像处理和加载。

TensorFlow：用于构建和训练深度学习模型。

NumPy：用于数值计算。

2. 加载和预处理图像
首先，我们需要加载图像并进行预处理。图像预处理的目的是将图像转换为模型可以接受的格式。

import cv2
import numpy as np

def load_image(image_path):
    # 加载图像
    image = cv2.imread(image_path)
    # 将图像转换为RGB格式
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    # 调整图像大小为224x224（根据模型输入要求）
    image = cv2.resize(image, (224, 224))
    # 归一化图像像素值到[0, 1]范围
    image = image / 255.0
    # 添加一个批次维度
    image = np.expand_dims(image, axis=0)
    return image

# 示例：加载一张图像
image_path = 'example.jpg'
image = load_image(image_path)

3. 加载预训练模型
为了简化图像识别任务，我们可以使用预训练的深度学习模型。TensorFlow提供了许多预训练模型，例如MobileNet、Inception等。这里我们使用MobileNetV2模型。

import tensorflow as tf

def load_model():
    # 加载MobileNetV2模型，不包括顶层（即分类层）
    model = tf.keras.applications.MobileNetV2(weights='imagenet', include_top=False, input_shape=(224, 224, 3))
    # 添加全局平均池化层
    x = tf.keras.layers.GlobalAveragePooling2D()(model.output)
    # 添加全连接层，输出1000个类别（对应ImageNet数据集）
    predictions = tf.keras.layers.Dense(1000, activation='softmax')(x)
    # 构建最终模型
    final_model = tf.keras.models.Model(inputs=model.input, outputs=predictions)
    return final_model

# 加载模型
model = load_model()

4. 图像识别
现在我们可以使用加载的模型对图像进行识别。我们将使用ImageNet数据集的标签来解码预测结果。

def decode_predictions(preds):
    # 加载ImageNet标签
    with open('imagenet_labels.txt') as f:
        labels = f.readlines()
    # 获取预测结果的类别索引
    class_idx = np.argmax(preds)
    # 返回对应的类别标签
    return labels[class_idx]

# 对图像进行预测
preds = model.predict(image)
# 解码预测结果
label = decode_predictions(preds)
print(f'Predicted label: {label}')

5. 完整代码
以下是完整的Python图片识别脚本：

import cv2
import numpy as np
import tensorflow as tf

def load_image(image_path):
    image = cv2.imread(image_path)
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    image = cv2.resize(image, (224, 224))
    image = image / 255.0
    image = np.expand_dims(image, axis=0)
    return image

def load_model():
    model = tf.keras.applications.MobileNetV2(weights='imagenet', include_top=False, input_shape=(224, 224, 3))
    x = tf.keras.layers.GlobalAveragePooling2D()(model.output)
    predictions = tf.keras.layers.Dense(1000, activation='softmax')(x)
    final_model = tf.keras.models.Model(inputs=model.input, outputs=predictions)
    return final_model

def decode_predictions(preds):
    with open('imagenet_labels.txt') as f:
        labels = f.readlines()
    class_idx = np.argmax(preds)
    return labels[class_idx]

# 加载图像
image_path = 'example.jpg'
image = load_image(image_path)

# 加载模型
model = load_model()

# 进行预测
preds = model.predict(image)
label = decode_predictions(preds)
print(f'Predicted label: {label}')

6. 运行脚本
将上述代码保存为image_recognition.py，然后在终端中运行：

python image_recognition.py

确保你已经准备好一张名为example.jpg的图像，并且在同一目录下有imagenet_labels.txt文件（包含ImageNet数据集的标签）。

7. 总结
通过本文，你已经学会了如何使用Python编写一个简单的图片识别脚本。我们使用了OpenCV进行图像预处理，TensorFlow加载预训练模型，并对图像进行识别。你可以在此基础上进一步扩展，例如使用其他预训练模型、训练自己的模型，或者将图像识别应用到实际项目中。

最后：
希望你编程学习上不急不躁,按照计划有条不紊推进,把任何一件事做到极致,都是不容易的,加油,努力！相信自己！

文末福利
最后这里免费分享给大家一份Python全套学习资料，希望能帮到那些不满现状，想提升自己却又没有方向的朋友，也可以和我一起来学习交流呀。

包含编程资料、学习路线图、源代码、软件安装包等！【点击这里领取！】
① Python所有方向的学习路线图，清楚各个方向要学什么东西
② 100多节Python课程视频，涵盖必备基础、爬虫和数据分析
③ 100多个Python实战案例，学习不再是只会理论
④ 华为出品独家Python漫画教程，手机也能学习

在这里插入图片描述