ctc_loss_calculator.cc:144] No valid path found.或loss: inf

举个例子，你图片高度为32，宽度为160，那么input_length=40（160 // 4这里取决于网络结构，输入图像长度为160，除以4是因为有两个pool层）。
label='abbbccddddcccaa'，label_length=15，经过计算repreat_number=2(bbb)+1(cc)+3(dddd)+2(ccc)+1(aa)，然后再加上开头结果的空符数2，最终等于11。也就是说必须满足label_length(15)+repreat_number(11)<=input_length(40)的图片才是合格的图片。

实现代码：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

# 读取图像
Img = np.array(Image.open(ImgRootPath + '/' + imgName).convert('L'))
ResizedImg = cv2.resize(Img, (int(Img.shape[1] * (32 / Img.shape[0])), 32))

# 统计Label中重复元素
l = [len(list(g)) for k, g in itertools.groupby(Label)]
repeat_number = 0
for n in l:
if n > 1:
repeat_number += (n - 1)

# 获得输入CTC Loss时的input_length，这主要取决于输入图像的尺寸
input_length = ResizedImg.shape[1] // 4

# 最终判断是否为合格图像
if len(Label) + repeat_number + 2 > input_length:
continue

总结

通过以上对数据集进行过滤处理后，一般都能解决该文章题目问题。

参考资料

[1] 训练CRNN时，关于ctc_loss的几点注意事项
[2] CTC Algorithm Explained Part 1：Training the Network（CTC算法详解之训练篇）

码农家园

ctc_loss_calculator.cc:144] No valid path found.或loss: inf

目录

引言

问题分析及解决方案

总结

参考资料