FSCrawler не может найти существующие вакансии

Я довольно новичок в Elastic Stack и хочу индексировать документы с помощью FSCrawler. У меня возникает странная проблема:

Я создаю новую работу и получаю подтверждение, что она была успешно создана. Я вижу только что созданную папку с именем работы.

Проблема в том, что FSCrawler почему-то не может найти новые сгенерированные задания.

Я генерирую работу, используя следующую команду в PS:

PS C:ELKfscrawler> bin/fscrawler testJobLaaKii
10:22:28,708 INFO  [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.4mb/247.5mb=3.43%], RAM [2.4gb/7.8gb=31.33%], Swap [4.6gb/12.5gb=37.33%].
10:22:28,724 WARN  [f.p.e.c.f.c.FsCrawlerCli] job [testJobLaaKii] does not exist
10:22:28,726 INFO  [f.p.e.c.f.c.FsCrawlerCli] Do you want to create it (Y/N)?
y
10:22:31,190 INFO  [f.p.e.c.f.c.FsCrawlerCli] Settings have been created in [C:Users<username>.fscrawler	estJobLaaKii\_settings.yaml]. Please review and edit before relaunch

Но всякий раз, когда я хочу его запустить, кажется, что FSCrawler не может его найти.

PS C:ELKfscrawler> bin/fscrawler
10:24:49,361 INFO  [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.6mb/247.5mb=3.48%], RAM [2.4gb/7.8gb=31.38%], Swap [4.6gb/12.5gb=37.06%].
10:24:49,373 INFO  [f.p.e.c.f.c.FsCrawlerCli] No job specified. Here is the list of existing jobs:
10:24:49,378 INFO  [f.p.e.c.f.c.FsCrawlerCli] No job exists in [C:Users<username>.fscrawler].
10:24:49,378 INFO  [f.p.e.c.f.c.FsCrawlerCli] To create your first job, run 'fscrawler job_name' with 'job_name' you want

Хотя работа четко создана:

файловая система с новым сгенерированным заданием

Всего 1 ответ


Ооо, после нахождения этого видео: индексирование многих файлов PDF для полнотекстового поиска с использованием Elasticsearch

Я решил это с помощью команды, которую он показал в видео:

binfscrawler --config_dir ./DS data_science --loop 1

вместо моей более короткой версии. Я не могу сказать, в чем проблема при использовании более короткой версии, и я до сих пор не вижу своих рабочих мест в списке при выполнении binfscrawl но как-то это работает ...


Есть идеи?

10000