Могу ли я создать универсальную функцию для сортировки списков событий?

Я работаю над проектом, в котором я хочу отобразить большой список событий, но для этого мне нужно вывести данные о событиях с нескольких сайтов. Некоторые из них имеют календари, некоторые из них имеют простые HTML-списки; в основном, каждый сайт предлагает данные по-разному.

Должен ли я очищать каждый сайт по отдельности или есть универсальная функция, которую я мог бы создать, чтобы сохранить данные с каждого веб-сайта?

Спасибо!

Всего 1 ответ


Я бы рекомендовал вам Nokogiri очистить данные из ваших источников. Вам нужно будет указать теги HTML, откуда вы хотите извлечь информацию, Nokogiri будет анализировать HTML и давать селекторам, которые позволят вам перемещаться по разборному DOM.

Вы можете использовать что-то вроде Portia, если хотите очистить данные, но вам нужно оценить, является ли это правильным инструментом на основе веб-сайтов, которые вы хотите очистить.


Есть идеи?

10000