python - языков - Как перебрать этот n-мерный набор данных?



семь баз за семь недель pdf (1)

Вы можете использовать itertools.product для итерации по декартовому произведению 1 некоторых значений (в данном случае индексов):

import itertools
shape = [4,5,2,6]
for idx in itertools.product(*[range(s) for s in shape]):
    value = dataset[idx]
    print(idx, value)
    # i would be "idx[0]", j "idx[1]" and so on...

Однако, если это массив numpy, который вы хотите перебрать, было бы проще использовать np.ndenumerate :

import numpy as np

arr = np.random.random([4,5,2,6])
for idx, value in np.ndenumerate(arr):
    print(idx, value)
    # i would be "idx[0]", j "idx[1]" and so on...

1 Вы попросили уточнить, что такое itertools.product(*[range(s) for s in shape]) самом деле. Поэтому я объясню это более подробно.

Например, у вас есть этот цикл:

for i in range(10):
    for j in range(8):
        # do whatever

Это также можно записать с использованием product как:

for i, j in itertools.product(range(10), range(8)):
#                                        ^^^^^^^^---- the inner for loop
#                             ^^^^^^^^^-------------- the outer for loop
    # do whatever

Это означает, что product - это просто удобный способ уменьшить количество независимых for-loops.

Если вы хотите преобразовать переменное число for -loops в product вам понадобятся два шага:

# Create the "values" each for-loop iterates over
loopover = [range(s) for s in shape]

# Unpack the list using "*" operator because "product" needs them as 
# different positional arguments:
prod = itertools.product(*loopover)

for idx in prod:
     i_0, i_1, ..., i_n = idx   # index is a tuple that can be unpacked if you know the number of values.
                                # The "..." has to be replaced with the variables in real code!
     # do whatever

Это эквивалентно:

for i_1 in range(shape[0]):
    for i_2 in range(shape[1]):
        ... # more loops
            for i_n in range(shape[n]):  # n is the length of the "shape" object
                # do whatever

У меня есть dataset который имеет 4 измерения (на данный момент ...), и мне нужно перебирать его.

Чтобы получить доступ к значению в dataset , я делаю это:

value = dataset[i,j,k,l]

Теперь я могу получить shape для dataset :

shape = [4,5,2,6]

Значения в shape представляют длину измерения.

Как, учитывая количество измерений, можно ли перебирать все элементы в моем наборе данных? Вот пример:

for i in range(shape[0]):
    for j in range(shape[1]):
        for k in range(shape[2]):
            for l in range(shape[3]):
                print('BOOM')
                value = dataset[i,j,k,l]

В будущем shape может измениться. Так, например, shape может иметь 10 элементов, а не текущий 4.

Есть ли хороший и чистый способ сделать это с Python 3?





iteration