Java - извлечь содержимое в квадратных скобках (игнорировать вложенные квадратные скобки)?

Я хочу извлечь содержимое строки в квадратных скобках ( если внутри одной квадратной скобки содержатся вложенные квадратные скобки , это следует игнорировать ).

Пример:

c[ts[0],99:99,99:99] + 5 - d[ts[1],99:99,99:99, ts[2]] + 5

Должен вернуться:

 match1 = "ts[0],99:99,99:99";
 match2 = "ts[1],99:99,99:99, ts[2]";

Код, который у меня есть, работает только с не вложенными квадратными скобками

String in = "c[ts[0],99:99,99:99] + 5 - d[ts[1],99:99,99:99, ts[2]] + 5";

Pattern p = Pattern.compile("\[(.*?)\]");
Matcher m = p.matcher(in);

while(m.find()) {
    System.out.println(m.group(1));
}

// print: ts[0, ts[1, 2

Всего 4 ответа


Я сделал функцию, чтобы сделать это (не с регулярным выражением, но это работает)

  for (int i = 0; i < in.length(); i++){
        char c = in.charAt(i);
        String part = String.valueOf(c);
        int numberOfOpenBrackets = 0;
        if (c == '[') {
            part = "";
            numberOfOpenBrackets++;
            for (int j = i + 1; j < in.length(); j++) {
                char d = in.charAt(j);
                if (d == '[') {
                    numberOfOpenBrackets++;
                }
                if (d == ']') {
                    numberOfOpenBrackets--;
                    i = j;
                    if (numberOfOpenBrackets == 0) {
                        break;
                    }
                }
                part += d;
            }

            System.out.println(part);
            part = "[" + part + "]";
        }

        result += part;
    }

    // print: ts[0],99:99,99:99
    //        ts[1],99:99,99:99, ts[2]

Без регулярных выражений; просто прям ява

import java.util.ArrayList;
import java.util.List;

public class BracketParser {

    public static List<String> parse(String target) throws Exception {
        List<String> results = new ArrayList<>();
        for (int idx = 0; idx < target.length(); idx++) {
            if (target.charAt(idx) == '[') {
                String result = readResult(target, idx + 1);
                if (result == null) throw new Exception();
                results.add(result);
                idx += result.length() + 1;
            }
        }
        return results;
    }

    private static String readResult(String target, int startIdx) {
        int openBrackets = 0;
        for (int idx = startIdx; idx < target.length(); idx++) {
            char c = target.charAt(idx);
            if (openBrackets == 0 && c == ']')
                return target.substring(startIdx, idx); 
            if (c == '[') openBrackets++;
            if (c == ']') openBrackets--;
        }
        return null;
    }

    public static void main(String[] args) throws Exception {
        System.out.println(parse("c[ts[0],99:99,99:99] + 5 - d[ts[1],99:99,99:99, ts[2]] + 5"));
    }
}

Возможно, вы захотите добавить правильную границу в ваше выражение, и начните и проведите все между ними, что может работать, может быть, похоже на это выражение :

(ts.*?)(]s++)

Если у нас есть несколько символов здесь: (s+) , вы можете просто добавить его с логическими ИЛИ в список символов, и он все равно будет работать.

RegEx

Если это не было вашим желаемым выражением, вы можете изменить / изменить выражения в regex101.com . введите описание изображения здесь

RegEx Circuit

Вы также можете визуализировать ваши выражения в jex.im :

введите описание изображения здесь


Если вложенность только один уровень, вы можете искать последовательность в скобках:

  • последовательность:
  • либо не [
  • или [ сопровождается кратчайшей последовательностью до ]

Так

Pattern p = Pattern.compile("\[([^\[]|\[.*?\])*\]");
//                             [                   ]
//                              ( not-[ or
//                                        [, shortest sequence to ]
//                                               )* repeatedly

Проблема в том, что скобки должны быть правильно спарены: синтаксические ошибки не допускаются.


Есть идеи?

10000