Поиск слов и фраз по нескольким полям в ElasticSearch

Я хотел бы искать документы, используя Python через ElasticSearch. Я ищу документы, которые содержат слово и / или фразу в любом из трех полей.

GET /my_docs/_search
{
  "query": {
    "multi_match": {
      "query": "Ford "lone star"",
      "fields": [
        "title",
        "description",
        "news_content"
      ],
      "minimum_should_match": "-1",
      "operator": "AND"
    }
  }
}

В приведенном выше запросе я хотел бы получить документы, заголовок, описание или news_content которых содержат "Ford" и "lone star" (как фразу).

Тем не менее, похоже, что он не считает «одинокой звездой» фразу. Возвращает документы с «Фордом», «Одиноким» и «Звездой».

Всего 1 ответ


Итак, я смог воспроизвести вашу проблему и решить ее с помощью REST API Elasticsearch, так как я не знаком с синтаксисом python и рад, что вы предоставили свой поисковый запрос в формате JSON, и я построил свое решение поверх него.

Индекс определения

{
    "mappings": {
        "properties": {
            "title": {
                "type": "text"
            },
            "description" :{
                "type" : "text"
            },
            "news_content" : {
                "type" : "text"
            }
        }
    }
}

Образцы документов

{
  "title" : "Ford",
  "news_content" : "lone star", --> note this matches your criteria
  "description" : "foo bar"
}

{
  "title" : "Ford",
  "news_content" : "lone",
  "description" : "star"
}

Поисковый запрос, который вы ищете

{
    "query": {
        "bool": {
            "must": [ --> note this, both clause must match
                {
                    "multi_match": {
                        "query": "ford",
                        "fields": [
                            "title",
                            "description",
                            "news_content"
                        ]
                    }
                },
                {
                    "multi_match": {
                        "query": "lone star",
                        "fields": [
                            "title",
                            "description",
                            "news_content"
                        ],
                        "type": "phrase" --> note `lone star` must be phrase
                    }
                }
            ]
        }
    }
}

Результат содержит только один документ из образца

"hits": [
      {
        "_index": "so_phrase",
        "_type": "_doc",
        "_id": "1",
        "_score": 0.9527341,
        "_source": {
          "title": "Ford",
          "news_content": "lone star",
          "description": "foo bar"
        }
      }
    ]

Есть идеи?

10000