我会尽力帮助你。 CNN(卷积神经网络)使用独特的输入数据,而不是矩阵(超像素是矩阵)。因此,为此,您需要删除每个超像素并使其成为自己的图像。因此,换句话说,如果您将图像分割成300个超像素,之后,您需要创建300个新图像,每个超像素之一。 在此之后,众所周知,每个新图像可能会有不同的尺寸。你不能这样工作,因为CNN中输入的神经元数量不能改变。为此,您可以将每个“新图像”集中在背景NxN中(“N”必须足以覆盖所有新图像)。使用集中式超像素(新图像集中),每个像素将输入您的CNN。换句话说: 1)每个集中的超像素将一次输入一个; 2)CNN中的输入量为X * Y,X为超像素集中的形状[0],Y为超像素集中的形状[1]; 3)300个超像素集中,你的CNN必须计算每个超级像素的输出。
Ilustration: https://imgur.com/k8pRDw7
看看ilustration和祝你好运! :)