author: sz_jmu

前言#

TensorFlow 是一个用于机器学习和深度学习的开源框架，由 Google Brain 团队开发并在 2015 年发布。它是目前最流行的深度学习框架之一，广泛用于构建、训练和部署机器学习模型，特别是在处理复杂的神经网络任务时。TensorFlow 提供了灵活的工具和库，支持从研究到生产环境中的机器学习应用。

TensorFlow可以支持CPU，也可以支持CPU+GPU，前者配置较为简单，兼容性较好，后者需要一些额外的操作支持。

在训练规模庞大的模型时，使用CPU往往存在较大的性能限制，模型训练速度较慢。神经网络算法通常涉及大量的参数、激活值、梯度值的缓冲区，其中每个值在每一次训练迭代中国都要被完全更新，有可能会超出传统计算机的高速缓存（Cache），所以内存带宽通常会成为主要瓶颈。而与CPU相比，GPU的一个显著优势就是具有极高的内存带宽。神经网络的训练算法通常不涉及大量的分支运算和复杂控制指令，更适合在GPU硬件上完成，具有并行特性的GPU更适合神经网络的计算，因此，安装TensorFlow的GPU环境是合适的选择。

参考文章：

解决tensorflow-gpu版本训练loss一直为nan，或者loss，accuracy数值明显不对问题_采用gpu训练 loss为负数采用cpu训练正常-CSDN博客

注意：配置Tensorflow gpu版本，建议使用Anoconda创建环境，避免出现污染环境变量等问题，Anoconda的配置与使用，不做过多赘述。

一、Tensorflow环境的基本配置#

Tensorflow的GPU环境，在不同的系统下配置存在一些兼容性问题，如果直接安装最新的版本，很难完成通过GPU进行深度学习相关的环境搭建。

CUDA,cuDNN,python,tensorflow的版本需要一一对应。

使用如：python=3.8 CUDA=11.3 cuDNN=8.2.1 tensorflow-gpu=2.7.0，运行较为稳定。

在Anoconda命令行环境下，创建Tensorflow的专属环境。

1
conda create -n tf_gpu_1 python==3.8

诸如CSDN等网站，许多参考文章说明要从Nivida官网安装CUDA，比较耗时麻烦，实际上tensorflow需要的是CUDA中的cudatoolkit，所以在Anoconda环境下进行如下安装操作即可：

1
conda install cudatoolkit=11.3

安装cudnn,实际上作用是CUDA的补丁包

1
conda install cudnn=8.2.1

安装tensorflow-gpu版本

1
conda install tensorflow-gpu=2.7.0

安装完成后，在tf_gpu_1环境中，检查是否能够查找到显卡驱动

1
nvidia-smi

检查tensorflow是否识别到GPU设备

1.进入python命令行环境

1
python

2.导入tensorflow库

1
import tensorflow as tf

3.是否查找到GPU设备

1
print("是否有 GPU 设备:", len(tf.config.list_physical_devices('GPU')) > 0)

如果tensorflow环境配置正常，能够正常识别到主机GPU，tensorflow深度学习框架基本搭建完成，由于此例使用的tensorflow和python版本不是当前最高版本，后续自行编写相关代码可能需要根据具体的情况安装更多的依赖包或对代码进行调整。

二、手写汉字识别神经网络模型训练#

1.数据集的准备#

要实现手写汉字识别，需要准备规模庞大的数据集。仅仅是常见的汉字数据集，就有高达七千多种类别，且汉字书法风格迥异，若要训练出泛化性强，准确度高的神经网络模型，就需要足够充分复杂的数据集，数据集即要体现出汉字的普遍特征，也要具备不同的形式风格，通过数据集也可以预料到需要足够强大的模型才能实现对任意手写汉字的识别。

例如，常见手写汉字识别数据集的下载：

汉字名为类别标签的手写数据集 (747M)

文件结构如下：

├── data
│ ├── chinese-calligraphy-dataset
│ │ ├── ㄚ
│ │ ├── 一
│ │ ├── 丁
│ │ ├── 七
│ │ ├── 万
│ │ └── …
│ └── label_character.csv

2.编写Tensorflow工具链与使用说明#

准备好数据集后，我们首先要做的工作是对数据集进行处理，使其符合神经网络模型训练的规范格式，其次，也有一些通过程序的方法能够对原始数据集进行处理，增加数据集的多样性，我们使用的方法为“数据增强”，即在原始数据集的基础上，对每张图片进行小幅度旋转，对比度调节，平移，压缩，放大等操作，这样有利于提高最后训练的模型的泛化性。

注意：代码运行需要在在命令行的本例：tf_gpu_1的环境中运行

2.1数据集划分脚本#

本脚本分为三个阶段：

1.将原始数据集复制到指定目录，并且分为test,val,train，即测试集，验证集，训练集。

2.对分类后的数据集进行数据增强，每张图片生成5张增强后的图像，那么，数据集的复杂程度得到了一定的增加

3.检查测试集中是否存在空的子文件夹，由于有些类别的汉字图片可能较少，按照代码中：20%的比例从训练集划分给测试集，若测试集图片少于2张，可能导致测试集中该类别没有对应的图片，所以，这个阶段用于对测试集文件夹进行二次排查，确保测试集中不存在空的汉字类别图片。

使用方法：

修改

1
src_data_folder = "S:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/CursiveChineseCalligraphyDataset-master/Cursive_Chinese_Calligraphy_Dataset/Training"  # todo 修改你的原始数据集路径
2
target_data_folder = "s:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-caoshu"  #

其中src_data_folder为原始数据集路径，target_data_folder为划分好的目标路径(将包含train,val,test三个子文件夹)

在tf_gpu_1环境下，输入命令 python data_split.py

完整代码(data_split.py)如下：

1
import os
2
import random
3
from shutil import copy2, move
4
from concurrent.futures import ThreadPoolExecutor
5
from tqdm import tqdm
6
from PIL import Image, ImageEnhance
7

8
def copy_file(src_dest):
9
    src_img_path, target_folder = src_dest
10
    copy2(src_img_path, target_folder)
11
def move_file(src_dest):
12
    src_img_path, target_folder = src_dest
13
    move(src_img_path, target_folder)
14
def augment_image(src_img_path, target_folder, num_augments=5):
15
    img = Image.open(src_img_path)
16
    for i in range(num_augments):
17
        img_aug = img.copy()
18

19
        # 随机旋转
20
        angle = random.uniform(-15, 15)  # -15到15度之间的随机旋转
21
        img_aug = img_aug.rotate(angle, fillcolor='white')
22

23
        # 随机平移
24
        max_translate = 5  # 最大平移像素值
25
        x_translate = random.randint(-max_translate, -max_translate)
26
        y_translate = random.randint(-max_translate, -max_translate)
27
        img_aug = img_aug.transform(img_aug.size, Image.AFFINE, (1, 0, x_translate, 0, 1, y_translate),
28
                                    fillcolor='white')
29

30
        # 随机缩放
31
        scale_factor = random.uniform(0.9, 1.1)
32
        w, h = img_aug.size
33
        img_aug = img_aug.resize((int(w * scale_factor), int(h * scale_factor)), Image.Resampling.LANCZOS)
34
        img_aug = img_aug.resize((w, h), Image.Resampling.LANCZOS)  # 重新调整为原始尺寸
35

36
        # 随机对比度调整
37
        enhancer = ImageEnhance.Contrast(img_aug)
38
        img_aug = enhancer.enhance(random.uniform(0.8, 1.2))
39

40
        # 随机亮度调整
41
        enhancer = ImageEnhance.Brightness(img_aug)
42
        img_aug = enhancer.enhance(random.uniform(0.8, 1.2))
43

44
        # 保存增强后的图像
45
        aug_img_name = os.path.basename(src_img_path).replace(".", f"_aug_{i}.")
46
        img_aug.save(os.path.join(target_folder, aug_img_name))
47

48

49
def data_set_split_and_augment(src_data_folder, target_data_folder, train_scale=0.8, val_scale=0.2, test_scale=0.0,
50
                               num_augments=5):
51
    '''
52
    读取源数据文件夹，生成划分好的文件夹，并对每张图片生成5张增强图片。
53
    :param src_data_folder: 源文件夹
54
    :param target_data_folder: 目标文件夹
55
    :param train_scale: 训练集比例
56
    :param val_scale: 验证集比例
57
    :param test_scale: 测试集比例
58
    :param num_augments: 每张图片生成的增强图片数量
59
    :return:
60
    '''
61
    class_names = os.listdir(src_data_folder)
62
    split_names = ['train', 'val', 'test']
63
    data_split_completed = True
64

65
    # 检查目标文件夹是否已存在文件，如果存在则跳过数据集划分
66
    for split_name in split_names:
67
        split_path = os.path.join(target_data_folder, split_name)
68
        if not os.path.exists(split_path) or len(os.listdir(split_path))

2.2数据集标签的提取#

此例汉字识别的类别高达7318种，并且为中文的格式，手动定义数据集的标签显然不太现实，因此，需要编写一个能够提取数据集标签的脚本。

使用方法：

在tf_gpu_1环境下使用命令 python labels_get.py运行此代码，将在代码相同目录下生成标签文件

完整代码(labels_get)如下

1
import tensorflow as tf
2
from pathlib import Path
3

4

5
# 数据集加载函数
6
def load_chinese_dataset(data_dir):
7
    # 使用 pathlib 处理路径
8
    data_dir = Path(data_dir).resolve()
9

10
    # 加载数据集，获取类别标签和图像数据
11
    dataset = tf.keras.preprocessing.image_dataset_from_directory(
12
        str(data_dir),
13
        label_mode='int',  # 使用整数标签
14
        seed=123,
15
        batch_size=32,  # 根据内存大小调整批量大小
16
        image_size=(256, 256)  # 根据需要调整图像大小
17
    )
18

19
    # 提取类别标签
20
    class_names = dataset.class_names
21

22
    # 打印类别标签
23
    print("类别标签（中文）：", class_names)
24

25
    # 保存标签到 Python 文件
26
    labels_file_path = Path(data_dir).parent / "lables_caoshu.py"
27
    with open(labels_file_path, 'w', encoding='utf-8') as file:
28
        file.write("labels_caoshu = [\n")
29
        for label in class_names:
30
            file.write(f"    '{label}',\n")
31
        file.write("]\n")
32

33
    print(f"标签已保存到 {labels_file_path}")
34

35
    # 返回数据集和标签
36
    return dataset, class_names
37

38

39
# 示例：使用指定路径加载汉字数据集
40
if __name__ == '__main__':
41
    data_dir = r"S:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-caoshu/train"
42
    dataset, chinese_labels = load_chinese_dataset(data_dir)
43

44
    # 打印一些样本数据
45
    for images, labels in dataset.take(1):
46
        print("图像批次：", images.numpy())
47
        print("标签批次：", labels.numpy())

2.3模型的训练#

2.3.1基于卷积神经网络(CNN)的模型训练#

1
import tensorflow as tf
2
import matplotlib.pyplot as plt
3
from time import time
4
from pathlib import Path
5
import os
6

7
# 设置环境变量以确保使用 UTF-8 编码
8
os.environ['PYTHONIOENCODING'] = 'utf-8'
9
os.environ['LANG'] = 'zh_CN.UTF-8'
10

11
# 数据集加载函数，指明数据集的位置并统一处理为imgheight*imgwidth的大小，同时设置batch
12
def data_load(data_dir, test_data_dir, img_height, img_width, batch_size):
13
    # 使用 pathlib 处理路径
14
    data_dir = Path(data_dir).resolve()
15
    test_data_dir = Path(test_data_dir).resolve()
16

17
    # 加载训练集
18
    train_ds = tf.keras.preprocessing.image_dataset_from_directory(
19
        str(data_dir),
20
        label_mode='categorical',
21
        seed=123,
22
        image_size=(img_height, img_width),
23
        batch_size=batch_size)
24
    # 加载测试集
25
    val_ds = tf.keras.preprocessing.image_dataset_from_directory(
26
        str(test_data_dir),
27
        label_mode='categorical',
28
        seed=123,
29
        image_size=(img_height, img_width),
30
        batch_size=batch_size)
31
    class_names = train_ds.class_names
32
    # 返回处理之后的训练集、验证集和类名
33
    return train_ds, val_ds, class_names
34

35
# 构建CNN模型
36
def model_load(IMG_SHAPE=(160, 160, 3), class_num=12):
37
    # 搭建模型
38
    model = tf.keras.models.Sequential([
39
        # 对模型做归一化的处理，将0-255之间的数字统一处理到0到1之间
40
        # 使用 Lambda 层代替 Rescaling 层以兼容旧版本 TensorFlow
41
        tf.keras.layers.Lambda(lambda x: x / 255.0, input_shape=IMG_SHAPE),
42
        # 卷积层，该卷积层的输出为32个通道，卷积核的大小是3*3，激活函数为relu
43
        tf.keras.layers.Conv2D(32, (3, 3), activation='relu'),
44
        # 添加池化层，池化的kernel大小是2*2
45
        tf.keras.layers.MaxPooling2D(2, 2),
46
        # Add another convolution
47
        # 卷积层，输出为64个通道，卷积核大小为3*3，激活函数为relu
48
        tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
49
        # 池化层，最大池化，对2*2的区域进行池化操作
50
        tf.keras.layers.MaxPooling2D(2, 2),
51
        # 将二维的输出转化为一维
52
        tf.keras.layers.Flatten(),
53
        # 和卷积前的例子一样，这里使用了 128 个全连接层和 10 个输出层
54
        tf.keras.layers.Dense(128, activation='relu'),
55
        # 通过softmax函数将模型输出为类名长度的神经元上，激活函数采用softmax对应概率值
56
        tf.keras.layers.Dense(class_num, activation='softmax')
57
    ])
58
    # 输出模型信息
59
    model.summary()
60
    # 指明模型的训练参数，优化器为sgd优化器，损失函数为交叉熵损失函数
61
    model.compile(optimizer='sgd', loss='categorical_crossentropy', metrics=['accuracy'])
62
    # 返回模型
63
    return model
64

65
# 展示训练过程的曲线
66
def show_loss_acc(history):
67
    # 从history中提取模型训练集和验证集准确率信息和误差信息
68
    acc = history.history['accuracy']
69
    val_acc = history.history['val_accuracy']
70
    loss = history.history['loss']
71
    val_loss = history.history['val_loss']
72

73
    # 按照上下结构将图画输出
74
    plt.figure(figsize=(8, 8))
75
    plt.subplot(2, 1, 1)
76
    plt.plot(acc, label='Training Accuracy')
77
    plt.plot(val_acc, label='Validation Accuracy')
78
    plt.legend(loc='lower right')
79
    plt.ylabel('Accuracy')
80
    plt.ylim([min(plt.ylim()), 1])
81
    plt.title('Training and Validation Accuracy')
82

83
    plt.subplot(2, 1, 2)
84
    plt.plot(loss, label='Training Loss')
85
    plt.plot(val_loss, label='Validation Loss')
86
    plt.legend(loc='upper right')
87
    plt.ylabel('Cross Entropy')
88
    plt.title('Training and Validation Loss')
89
    plt.xlabel('epoch')
90
    plt.savefig('results/results_cnn.png', dpi=100)
91

92
def train(epochs):
93
    # 开始训练，记录开始时间
94
    begin_time = time()
95
    # 加载数据集， 修改为你的数据集的路径
96
    train_ds, val_ds, class_names = data_load(
97
        r"S:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-all-more/train",
98
        r"S:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-all-more/val",
99
        160, 160, 32)
100
    print("类别标签（中文）：", class_names)
101
    # 加载模型
102
    model = model_load(class_num=len(class_names))
103
    # 指明训练的轮数epoch，开始训练
104
    history = model.fit(train_ds, validation_data=val_ds, epochs=epochs)
105
    # 保存模型， 修改为你要保存的模型的名称
106
    model.save("models/cnn_hanzi_2.h5")
107
    # 记录结束时间
108
    end_time = time()
109
    run_time = end_time - begin_time
110
    print('该循环程序运行时间：', run_time, "s")  # 该循环程序运行时间： 1.4201874732
111
    # 绘制模型训练过程图
112
    show_loss_acc(history)
113

114
if __name__ == '__main__':
115
    train(epochs=40)

2.3.2基于残差神经网络(Resnet)的模型训练#

汉字识别模型类别非常多，使用一般的神经网络训练出来的模型可能泛化性并不理想，针对多类别的模型训练可以采用更复杂的网络，比如本例的Resnet残差神经网络，最终训练的模型准确率和泛化性极高。

使用方法：

代码片段中，修改路径为已经划分好的训练集，测试集路径

1
train_ds, val_ds, class_names = data_load(
2
    r"s:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-caoshu/train",
3

4
    r"s:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-caoshu/val",
5
    128, 128, 64)  # 减小批处理大小

模型保存名称修改

1
model.save("models/final_resnet50_chinese_kai", save_format='tf')

在tf_gpu_1环境下，使用命令 python model_train_resnet50.py

1
import tensorflow as tf
2
import matplotlib.pyplot as plt
3
from time import time
4
from pathlib import Path
5
import os
6

7
# 设置环境变量以确保使用 UTF-8 编码
8
os.environ['PYTHONIOENCODING'] = 'utf-8'
9
os.environ['LANG'] = 'zh_CN.UTF-8'
10

11
# 启用混合精度训练
12
from tensorflow.keras.mixed_precision import experimental as mixed_precision
13
policy = mixed_precision.Policy('mixed_float16')
14
mixed_precision.set_policy(policy)
15

16
# 数据加载函数，加入数据增强
17
def data_load(data_dir, test_data_dir, img_height, img_width, batch_size):
18
    data_dir = Path(data_dir).resolve()
19
    test_data_dir = Path(test_data_dir).resolve()
20

21
    # 加载训练集
22
    train_ds = tf.keras.preprocessing.image_dataset_from_directory(
23
        str(data_dir),
24
        label_mode='categorical',
25
        seed=123,
26
        image_size=(img_height, img_width),
27
        batch_size=batch_size
28
    )
29

30
    # 获取类别标签
31
    class_names = train_ds.class_names
32

33
    # 数据增强
34
    data_augmentation = tf.keras.Sequential([
35
        tf.keras.layers.experimental.preprocessing.RandomFlip('horizontal'),
36
        tf.keras.layers.experimental.preprocessing.RandomRotation(0.1),
37
    ])
38

39
    # 加入数据增强
40
    train_ds = train_ds.map(lambda x, y: (data_augmentation(x), y), num_parallel_calls=tf.data.experimental.AUTOTUNE)
41

42
    # 加载测试集
43
    val_ds = tf.keras.preprocessing.image_dataset_from_directory(
44
        str(test_data_dir),
45
        label_mode='categorical',
46
        seed=123,
47
        image_size=(img_height, img_width),
48
        batch_size=batch_size
49
    )
50

51
    # 预取数据
52
    train_ds = train_ds.prefetch(buffer_size=tf.data.experimental.AUTOTUNE)
53
    val_ds = val_ds.prefetch(buffer_size=tf.data.experimental.AUTOTUNE)
54

55
    return train_ds, val_ds, class_names
56

57
# 构建ResNet模型
58
def model_load(IMG_SHAPE=(128, 128, 3), class_num=7200):
59
    resnet = tf.keras.applications.ResNet50(weights='imagenet', include_top=False, input_shape=IMG_SHAPE)
60

61
    model = tf.keras.models.Sequential([
62
        resnet,
63
        tf.keras.layers.GlobalAveragePooling2D(),
64
        tf.keras.layers.Dense(1024, activation='relu'),
65
        tf.keras.layers.Dropout(0.5),
66
        tf.keras.layers.Dense(class_num, activation='softmax')
67
    ])
68

69
    model.summary()
70

71
    initial_learning_rate = 0.01
72
    lr_schedule = tf.keras.optimizers.schedules.ExponentialDecay(
73
        initial_learning_rate, decay_steps=10000, decay_rate=0.9, staircase=True
74
    )
75

76
    optimizer = tf.keras.optimizers.SGD(learning_rate=lr_schedule, momentum=0.9)
77

78
    model.compile(optimizer=optimizer,
79
                  loss='categorical_crossentropy',
80
                  metrics=['accuracy'])
81

82
    return model
83

84
# 展示训练过程的曲线
85
def show_loss_acc(history):
86
    acc = history.history['accuracy']
87
    val_acc = history.history['val_accuracy']
88
    loss = history.history['loss']
89
    val_loss = history.history['val_loss']
90

91
    plt.figure(figsize=(8, 8))
92
    plt.subplot(2, 1, 1)
93
    plt.plot(acc, label='Training Accuracy')
94
    plt.plot(val_acc, label='Validation Accuracy')
95
    plt.legend(loc='lower right')
96
    plt.ylabel('Accuracy')
97
    plt.ylim([min(plt.ylim()), 1])
98
    plt.title('Training and Validation Accuracy')
99

100
    plt.subplot(2, 1, 2)
101
    plt.plot(loss, label='Training Loss')
102
    plt.plot(val_loss, label='Validation Loss')
103
    plt.legend(loc='upper right')
104
    plt.ylabel('Cross Entropy')
105
    plt.title('Training and Validation Loss')
106
    plt.xlabel('epoch')
107
    plt.savefig('results/results_resnet.png', dpi=100)
108

109
# 增加早停和模型检查点回调
110
def train(epochs):
111
    begin_time = time()
112

113
    train_ds, val_ds, class_names = data_load(
114
        r"s:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-caoshu/train",
115

116
        r"s:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-caoshu/val",
117
        128, 128, 64)  # 减小批处理大小
118

119
    print("类别标签（中文）：", class_names)
120

121
    model = model_load(class_num=len(class_names))
122

123
    early_stopping = tf.keras.callbacks.EarlyStopping(
124
        monitor='val_loss', patience=10, restore_best_weights=True
125
    )
126

127
    checkpoint = tf.keras.callbacks.ModelCheckpoint(
128
        'models/final_resnet50_chinese_kai', monitor='val_loss', save_best_only=True, save_format='tf'
129
    )
130

131
    history = model.fit(
132
        train_ds, validation_data=val_ds, epochs=epochs,
133
        callbacks=[early_stopping, checkpoint]
134
    )
135

136
    model.save("models/final_resnet50_chinese_kai", save_format='tf')
137

138
    end_time = time()
139
    run_time = end_time - begin_time
140
    print('该循环程序运行时间：', run_time, "s")
141

142
    show_loss_acc(history)
143
if __name__ == '__main__':
144
    train(epochs=15)

2.4 模型的测试#

代码如下，更改测试集以及模型路径为相应的目标路径即可

1
import tensorflow as tf
2
import matplotlib.pyplot as plt
3
import numpy as np
4
import os
5
import time
6
import random
7

8
# 设置Matplotlib显示中文
9
plt.rcParams['font.family'] = ['sans-serif']
10
plt.rcParams['font.sans-serif'] = ['SimHei']
11

12

13
# 数据加载
14
def data_load(data_dir, test_data_dir, img_height, img_width, batch_size):
15
    class_names = sorted(
16
        [dir_name for dir_name in os.listdir(data_dir) if os.path.isdir(os.path.join(data_dir, dir_name))])
17

18
    print(f"Detected {len(class_names)} classes.")
19

20
    def process_path(file_path):
21
        label = tf.strings.split(file_path, os.path.sep)[-2]
22
        label = tf.where(tf.equal(tf.constant(class_names), label))[0][0]
23
        img = tf.io.read_file(file_path)
24
        img = tf.image.decode_jpeg(img, channels=3)
25
        img = tf.image.resize(img, [img_height, img_width])
26
        return img, label
27

28
    def prepare_dataset(directory):
29
        list_ds = tf.data.Dataset.list_files(os.path.join(directory, '*/*'), shuffle=True)
30
        labeled_ds = list_ds.map(process_path, num_parallel_calls=tf.data.experimental.AUTOTUNE)
31
        labeled_ds = labeled_ds.batch(batch_size).prefetch(buffer_size=tf.data.experimental.AUTOTUNE)
32
        return labeled_ds
33

34
    train_ds = prepare_dataset(data_dir)
35
    val_ds = prepare_dataset(test_data_dir)
36

37
    print(f"Loaded datasets: {len(train_ds)} training batches, {len(val_ds)} validation batches.")
38

39
    return train_ds, val_ds, class_names
40

41

42
# 聚合类别并随机抽取10个类别生成热力图
43
def aggregate_labels_and_select(real_labels, pred_labels, num_classes, num_groups, selected_groups):
44
    group_size = num_classes // num_groups
45
    real_labels_agg = [label // group_size for label in real_labels]
46
    pred_labels_agg = [label // group_size for label in pred_labels]
47

48
    real_labels_selected = [real_labels_agg[i] for i in range(len(real_labels_agg)) if
49
                            real_labels_agg[i] in selected_groups]
50
    pred_labels_selected = [pred_labels_agg[i] for i in range(len(pred_labels_agg)) if
51
                            real_labels_agg[i] in selected_groups]
52

53
    return real_labels_selected, pred_labels_selected
54

55

56
# 测试cnn模型准确率
57
def test_cnn():
58
    # 加载数据
59
    start_time = time.time()
60
    train_ds, test_ds, class_names = data_load(
61
        r"S:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-all/train",
62
        r"S:/2_tensflow_Project/chinese-calligraphy-dataset-master/data/data-chinese-all/val",
63
        160, 160, 16)
64

65
    print(f"Data loading completed in {time.time() - start_time:.2f} seconds.")
66

67
    # 加载模型
68
    start_time = time.time()
69
    model = tf.keras.models.load_model("models/final_resnet50_chinese")
70
    print(f"Model loaded in {time.time() - start_time:.2f} seconds.")
71

72
    # 编译模型
73
    model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
74

75
    # 推理
76
    test_real_labels = []
77
    test_pre_labels = []
78
    print("Starting model inference...")
79
    inference_start_time = time.time()
80
    for batch_idx, (test_batch_images, test_batch_labels) in enumerate(test_ds):
81
        if batch_idx >= 10:  # 只处理前10个batch来加速测试
82
            break
83
        if batch_idx % 2

2.5 tensorboard工具——模型流图#

model = tf.saved_model.load(“models/final_resnet50_chinese”) 语句中修改为目标模型

1
import tensorflow as tf
2

3
# 假设你已经加载了你的模型
4
model = tf.saved_model.load("models/final_resnet50_chinese")
5

6
# 获取模型的推理签名（与导出的模型相关，可能需要调整具体签名名称）
7
infer = model.signatures['serving_default']
8

9
# 创建 TensorBoard 日志目录
10
log_dir = "logs/graph"
11
writer = tf.summary.create_file_writer(log_dir)
12

13

14
# 创建一个包装函数并使用 tf.function
15
@tf.function
16
def model_inference(input_tensor):
17
    return infer(input_tensor)
18

19

20
# 创建一个示例输入张量（调整形状以匹配模型的输入要求）
21
example_input = tf.random.normal([1, 160, 160, 3])  # 假设模型输入是160x160x3的图像
22

23
# 记录数据流图
24
with writer.as_default():
25
    # 开启追踪
26
    tf.summary.trace_on(graph=True, profiler=True)
27

28
    # 执行一次推理以记录计算图
29
    model_inference(example_input)
30

31
    # 记录计算图
32
    tf.summary.trace_export(name="model_trace", step=0, profiler_outdir=log_dir)
33

34
    writer.flush()
35

36
print("Graph has been written to TensorBoard logs. You can view it using TensorBoard.")

2.6 模型的使用#

本例为基于Qt界面的汉字识别程序，通过加载训练好的Tensorflow模型，选择本地的图片作为输入，进行手写汉字识别

1
# -*- coding: utf-8 -*-
2
# @Time    : 2021/6/17 20:29
3
# @Author  : dejahu
4
# @Email   : 1148392984@qq.com
5
# @File    : window.py
6
# @Software: PyCharm
7
# @Brief   : 图形化界面
8

9
import tensorflow as tf
10
from PyQt5.QtGui import *
11
from PyQt5.QtCore import *
12
from PyQt5.QtWidgets import *
13
import sys
14
import cv2
15
from PIL import Image
16
import numpy as np
17
import shutil
18
from lables_caoshu import labels_caoshu
19

20
class MainWindow(QTabWidget):
21
    def __init__(self):
22
        super().__init__()
23
        self.setWindowIcon(QIcon('images/logo.png'))
24
        self.setWindowTitle('CNN汉字识别系统')
25
        self.model = tf.keras.models.load_model("models/final_resnet50_chinese")
26
        self.to_predict_name = "images/Start_1.png"
27
        self.class_names = labels_caoshu
28
        self.resize(900, 700)
29
        self.initUI()
30

31
    def initUI(self):
32
        main_widget = QWidget()
33
        main_layout = QHBoxLayout()
34
        font = QFont('楷体', 15)
35

36
        dark_style = """
37
            QWidget {
38
                background-color: #2E2E2E;
39
                color: #FFFFFF;
40
            }
41
            QLabel {
42
                color: #FFFFFF;
43
            }
44
            QPushButton {
45
                background-color: #4F4F4F;
46
                border: 2px solid #6E6E6E;
47
                color: #FFFFFF;
48
                padding: 5px;
49
                border-radius: 5px;
50
            }
51
            QPushButton:hover {
52
                background-color: #6E6E6E;
53
            }
54
            QPushButton:pressed {
55
                background-color: #3D3D3D;
56
            }
57
            QTabBar::tab {
58
                background: #3D3D3D;
59
                color: #FFFFFF;
60
                padding: 10px;
61
                border-radius: 5px;
62
            }
63
            QTabBar::tab:selected {
64
                background: #2E2E2E;
65
                border-bottom: 2px solid #4F4F4F;
66
            }
67
            QTabBar::tab:!selected {
68
                background: #3D3D3D;
69
            }
70
        """
71
        self.setStyleSheet(dark_style)
72

73
        left_widget = QWidget()
74
        left_layout = QVBoxLayout()
75
        img_title = QLabel("输入作品")
76
        img_title.setFont(font)
77
        img_title.setAlignment(Qt.AlignCenter)
78
        self.img_label = QLabel()
79
        self.process_image(self.to_predict_name)
80
        self.img_label.setPixmap(QPixmap("images/binary_show.png"))
81
        left_layout.addWidget(img_title)
82
        left_layout.addWidget(self.img_label, 1, Qt.AlignCenter)
83
        left_widget.setLayout(left_layout)
84

85
        right_widget = QWidget()
86
        right_layout = QVBoxLayout()
87
        btn_change = QPushButton(" 上传作品 ")
88
        btn_change.setIcon(QIcon('images/upload.png'))
89
        btn_change.clicked.connect(self.change_img)
90
        btn_change.setFont(font)
91
        btn_predict = QPushButton(" 开始识别 ")
92
        btn_predict.setIcon(QIcon('images/recognize.png'))
93
        btn_predict.setFont(font)
94
        btn_predict.clicked.connect(self.predict_img)
95
        label_result = QLabel(' 识别结果 ')
96
        self.result = QLabel("等待识别")
97
        label_result.setFont(QFont('楷体', 16))
98
        self.result.setFont(QFont('楷体', 24))
99
        right_layout.addStretch()
100
        right_layout.addWidget(label_result, 0, Qt.AlignCenter)
101
        right_layout.addStretch()
102
        right_layout.addWidget(self.result, 0, Qt.AlignCenter)
103
        right_layout.addStretch()
104
        right_layout.addStretch()
105
        right_layout.addWidget(btn_change)
106
        right_layout.addWidget(btn_predict)
107
        right_layout.addStretch()
108
        right_widget.setLayout(right_layout)
109

110
        main_layout.addWidget(left_widget)
111
        main_layout.addWidget(right_widget)
112
        main_widget.setLayout(main_layout)
113

114
        about_widget = QWidget()
115
        about_layout = QVBoxLayout()
116
        about_title = QLabel('欢迎使用手写汉字识别系统')
117
        about_title.setFont(QFont('楷体', 18))
118
        about_title.setAlignment(Qt.AlignCenter)
119
        about_img = QLabel()
120
        about_img.setPixmap(QPixmap('images/CNN.png'))
121
        about_img.setAlignment(Qt.AlignCenter)
122
        label_super = QLabel("sz_jmu")
123
        label_super.setFont(QFont('楷体', 12))
124
        label_super.setAlignment(Qt.AlignRight)
125
        about_layout.addWidget(about_title)
126
        about_layout.addStretch()
127
        about_layout.addWidget(about_img)
128
        about_layout.addStretch()
129
        about_layout.addWidget(label_super)
130
        about_widget.setLayout(about_layout)
131

132
        self.addTab(main_widget, '主页')
133
        self.addTab(about_widget, '关于')
134
        self.setTabIcon(0, QIcon('images/主页面.png'))
135
        self.setTabIcon(1, QIcon('images/关于.png'))
136

137
    # 上传并显示图片
138
    def change_img(self):
139
        openfile_name = QFileDialog.getOpenFileName(self, 'chose files', '',
140
                                                    'Image files(*.jpg *.png *jpeg)')  # 打开文件选择框选择文件
141
        img_name = openfile_name[0]  # 获取图片名称
142
        if img_name

运行结果如下：

tensorflow_gpu_tools工具链总结：

data_split.py：数据集划分脚本
labels_get.py：标签生成脚本
model_train_resnet50.py：训练脚本
tf_board.py：模型结构/流图展示脚本
window.py：模型识别QT程序

更新记录#

此栏目用于记录代码项目新增功能，bug修复等日志

date:2024.8.29

对model_train_densenet169.py 新增参数接口化配置，使用命令行即可便捷配置模型训练参数

1
import argparse                          # 导入argparse模块以处理命令行参数

如：

1
python script_name.py --train_data_dir "path/to/train_data" --test_data_dir "path/to/test_data" --img_height 128 --img_width 128 --batch_size 64 --epochs 15

β\betaβα\alphaα