Импорт данных с каждым значением, содержащим метки столбцов

У меня есть данные в текстовом файле без заголовков. Значения в каждой строке имеют метку, указывающую, к какому столбцу они принадлежат. Я хочу взять эти метки в качестве имен столбцов и подать данные под столбцами.

Я хочу импортировать следующее из текстового документа (обратите внимание, что расположение значений под столбцами не является постоянным):

Column1=variable11&Column2=variable12&Column3=variable13&Column4=variable14
Column2=variable22&Column1=variable12&Column3=variable23
Column1=variable13&Column3=variable33&Column2=variable32&Column4=variable34&Column5=variable35

Я ожидаю, что результатом будет таблица, подобная этой:

Column1         Column2         Column3         Column4         Column5
variable11      variable12      variable13      variable14  
variable21      variable22      variable23      
variable31      variable32      variable33      variable34      variable35

Всего 1 ответ


Вы можете использовать для этого данные с Pandas:

import pandas as pd

a='''Column1=variable11&Column2=variable12&Column3=variable13&column4=variable14
Column2=variable22&Column1=variable12&Column3=variable23
Column1=variable13&Column3=variable33&Column2=variable32&Column4=variable34&Column5=variable35'''

result = []

for line in a.split('
'):
    dict_line = {}
    for chunk in line.split('&'):
        col, var = chunk.split('=')
        dict_line[col] = var
    result.append(dict_line)
pd.DataFrame(result)

вернет вам датафрейм:

    Column1     Column2     Column3     Column4     Column5     column4
0   variable11  variable12  variable13  NaN         NaN         variable14
1   variable12  variable22  variable23  NaN         NaN         NaN
2   variable13  variable32  variable33  variable34  variable35  NaN

Пустые ячейки в этом информационном кадре заполнены NaN


Есть идеи?

10000