Почему размер массива Train NumPy меньше, чем у всего набора данных?

форма

Я конвертировал все изображения размером 100 x 100 в массив numpy и сохранил его в текстовый файл. После загрузки и выполнения train_test_split они сохраняются в X_train и X_test соответственно. Тем не менее, форма становится (75,100). Разве это не должно быть (100,100)? Извините, я новичок в машинном обучении

Всего 1 ответ


Если у вас есть N изображений размером 100 X 100, вы должны передать массив с размером (N, 100, 100). Функция разбивается по первому измерению. Таким образом, если вы передаете один массив размером 100x100, он думает, что каждая строка вашего изображения является тренировочным шаблоном и сохраняет 3/4 изображения в качестве обучающего набора.


Есть идеи?

10000